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مركز البحوث والدراسات 


ثودة السانات 
نور » «>» 
البنانات التكبيرة والبيانات الفعوحة, والبنى القحنية للبيانات: 


والنتائج المترتبة عنها 


تأليف 


وه 


بروفيسور: روب كيتشن 


ترجمة: د. محمد بن أحمد غروى 
راجع الترجمة: ماجد بن عبدالعزيز البريثن 


5ه - 18١5م‏ 


(ح) معهد الإدارة العامةء 6179 اه 
فهرسة مكتبة املك فهد الوطنية أثناء النشر. 
ثورة البيانات المفتوحة والبنى التحتية للبيانات» والنتائج 
المترتبة عنها / روب كيتشنء محمد بن أحمد غرويء ماجد 
بن عبدالعزيز البريثن - الرياضء 675 اه 
ع*اص؟ 7 اسم كا 6اسم. 
ردمك: 6-890-0١1-.91و‏ 


-١‏ الإنترنت أ غروي محمد بن أحمد (مترجم) ب- البريثن,» 
ماجد بن عبدالعزيز (مراجع) ج- العنوان. 
ديوي لالارع.. 2 “الال ل/وطع١‏ 


رقم الإيداع: ١89/1118‏ 
ردمك: 1930-16-00 
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حول المؤلف 
البروفيسور روب كيتشن 


هو باحث رئيسي في ا مجلس الأوروبي للبحوث المتقدمة ([ك2ناه) لاعنتدعوع] صوء ممغتا) 
في جامعة إيرلندا الوطنية في ماينوث. وقد قام بتأليف وتحرير كتب عديدة أخرى ناهزت ثلاثة 
وعشرين كتاباً وكان قد حاز على الميدالية الذهبية للعلوم الاجتماعية من الأكادهية الملكية 
الأبرلندية للعام .5١١‏ وهو الباحث الرئيسي للحاوية الرقمية الأيرلندية والمرصد البحثي 
لعموم الجزيرة الأيرلندية. 
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العنوان الصفحة 

حول المؤلف 3ر27زي-3- 3 070707070707777#7ْ0:0:ة:ة ةزر 

قائمة المحتويات 'زُ ناا 0 

قائمة الجداول البيانية لل م 

قائمة الأشكال الرسومية 226 شرررتلّثزؤ ا ا ا ا سا 

شكر وتقدير ا ا اا اا از 002025 

ملاحظة ااا 000 0 
مقدمة 00000101 0 0 0 
الفصل الأول: تصور ملفهوم البيانات 010101 0 0 0 
الفصل الثاني: البيانات الصغيرة, والبنى التحتية للبيانات» ووسطاء البيانات ين 
الفصل الثالث: البيانات المفتوحة والبيانات المرتبطة 0131 0 
الفصل الرابع: البيانات الكبيرة اث ث7 ااا ا 
الفصل الخامس: ممكنات البيانات الكبيرة ومصادرها يةعية ة ةيز2زي2ي2ز2]ز]000000020201001]1]1ا0ع00 
الفصل السادس: آليات تحليل البيانات 1 
الفصل السابع: ا مبررات الحكومية والتجارية للبيانات الكبيرة 000000000000118 
الفصل الثامن: إعادة صياغة أبحاث العلوم: والعلوم الاجتماعية» والعلوم الإنسانية دا 
الفصل التاسع: القضايا الفنية والتنظيمية 58 
الفصل العاشر: اللمخاوف الأخلاقية: والسياسية: والاجتماعية» والقانونية ال م ا 
الفصل الحادي عشر: فهم ثورة البيانات حخذخ06 ا 
اطراجع 909ا60ا06طططططططققق7ق7ق7/ ورور زر 2 117077 
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قانئمة الجداول 


الجدول 
مستويات قياس البيانات |[ ا ا 20 
المستويات الستة لبيانات نظام رصد ومراقبة الأرض الخاص بوكالة الفضاء الأمريكية 2-0 
الأدوات والعناصر للجاميع البيانات 000 0 0 0 ةي 4يةي 5ي45ةية 0 0 0 050 0 0909090ا”'5آ 
مقارنة البيانات الصغيرة والبيانات الكبيرة 1251737071000 
أنواع وأمثلة البنى التحتية للبيانات 15170 


مجموعة منتقاة من مؤسسات تقديم ا مشورةء والضغط لكسب التأييدء والتنسيق 
للمحافظة على البيانات وإتاحتها للوصول والمشاركة وإعادة الاستخدام في العلوم 


الاجتماعية والإنسانية 11100 21070001 
فوائد مستودعات البيانات والبنى التحتية للبيانات ؤزآز[ ز ز[ز[ز ز ز ز[ [ز 0000010011 
الخصائص الثالية للبيانات ا مفتوحة المتعلقة بتعريف الانفتاح 07 
مبادئ منظمة الحوكمة المفتوحة للبيانات المفتوحة 5200 
المستويات الخمسة للبيانات المفتوحة والبيانات المرتبطة 5570« 
نماذج التمويل مبادرات البيانات المفتوحة ا 
مقاييس البيانات الرقمية 0009| | أب2 
مهام وأساليب التنقيب عن البيانات غتة > كك © ا 
أنماط ذكاء البيانات الكبيرة للشركات 01303039 0 203003103730702 
فوائد البيانات الكبيرة لعشر صناعات مختارة 8د طظ5 
نماذج العلم الأربعة ا 
الخبرات اللازمة لبناء البنى التحتية للبيانات وإجراء بحوث البيانات الكبيرة 505306 
تصنيف الخصوصية 13333373735357 
مبادئ ال ممارسة العادلة للمعلومات و ا 
أنواع ا معلومات ا محمية 3-98---3ت3ت- ت-0 
المبادئ السبعة الأساسية للخصوصية من خلال التصميم 10000009 
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ست 


51-6 


قائمة الأشكال الرسومية 


الشكل 
هرم ال معرفة ا ا لا ا ا و الا ا ا 
الأمئلة المتعلقة بالأفراد خلال التعداد السكاني الإيرلندي للسكان ما بين ١86١‏ -1991 5 
التقاطع بين أدوات مجاميع البيانات 131313317301969 
التوزيع الجغرافي لتغريدات التخوف من امثليّة في الولايات المتحدة الأمريكية مي 
المواقع اللحظية لمسار الرحلات الجوية 5 
لوحة معلومات مدينة لندن الخاصة بالمركز البريطاني للتحليل العمراني المتقدم ع 
مجموعة أدوات التحليلات الجغرافية الصورية التي وضعها المركز الوطني للتحليلات 
الصورية في جامعة ينكوبينج ((رانويء نمآ وطاو ةلع ا 0 
استخدام مجموعة أدوات التحليلات الجغرافية الصورية في بناء الرواية 
القصصية الجماعية 29200 
التسويق والبيانات الكبيرة 2 
مركز العمليات لوسط مدينة ريودي جانيرو 111110101100ط 
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15 


15 


ع1 


10 


لخرضا 


شكر وتقدير: 

بدأت نشأة هذا الكتاب في أوائل الشهر السابع (يوليو/ آيار) من العام 7١١7‏ خلال 
مناقشة بمقهى ف أدنبرة مع روبرت روجك (اءز20 10616) من شركة سايج للنشر 
(548©77). حيث كنت قد اقترحت عليه البحث عن شخص لكتابة مصئف عن البيانات 
الكبيرة والبيانات المفتوحة: والبنى التحتية للبيانات» مع تقديم الأفكار وإسداء النصح 
عن ذلك الفخص الذي قد يكون متاسباً لصياغة النص فى مثل هذا الموضوع. وكان يرى فى 
حينه أني ذلك الشخص المناسب لتلك المهمة. فقررت في وقت لاحقء بعد مضي عدة أشهر, 
الموافقة بين خطط كتاباق والجمع بينها. بحيث بدأت في صياغة ما بدا في متناول اليد خلال 
فترة زمنية قصيرة جداً ويتناول التحليل النقدي بمشهد البيانات المتغير باطراد. تطور الكتاب 
مع مرور الوقت إلى مخطوط كامل يسعى إلى الدراسة ا مستفيضة للاتجاهات والمناقشات 
الناشئة بتأن وإنصاف. وبالتزامن مع ذلك» بقي روبرت متابعاً متحمساً ومصدراً للعديد من 
المواد المثيرة للاهتمام, وكانت مساعدته موضع تقدير كبير جدا. وفي سايج أيضاًء ساعد زميله 
كيري ديكنز (25ع>ك101 11ع1) في الدفع بالكتاب إلى عملية الإنتاج والنشرء التي تم توجيهها 
على نحو مثير للإعجاب من قبل كاثرين هاو (250آ2 عستمعطاةك]). 


قام مارتن دودج (ع12008 ستامد/ة) وتريسي ب. لاوريولت (11113111هآ ,2 بوعع152) 
بقراءة مفصلة ونقد هادف للمخطوط بالكامل وعلى نحو متناه في السلاسة واللطف. وقام 
مارك بويل (©71إ80 ع81211) بقراءة كامل المسودة الثانية: كما قدّم غافن مكاردل (صتتكه© 
عللخء]!) وإيفلين روبيرت (620مم01 دتراء8) نقداً مفيداً لبعض فصول الكتابء وإضافة 
لذلك شارك عدد من الزملاء والأصدقاء في مداخلات نافعة ومناقشات مفيدة. حيث دلتي العديد 
منهم إلى مواد ذات صلةء منهم مارك غراهام (212ط62 ع381211).: تايلور شيلتون (1277102' 
دهع طة).: مات زوك 20012 غ]312): مات ويلسون (11711502 غ1126): ليف مانوفيتش (7ع6.آ1 
ط212201). سيان اوكالاهان (صقطئة1له0 ”0 سهن)ء سونغ - يوه بيرنج (أعنالآ 511118 
قاء2), أيلين أوه كار ول (1اه5تهن'0 دءءانة)ء جين جراي (1337© 326[): ساندرا كولينز 
(كصتلاهمن 552012): حون كيتنغ (28ندع1 صطه[)ء شارون ويب (1100 512102): جوستين 
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تمهيد 


جليسون («موء»16© صنتاكنا[)؛ أو يف داولنغ (28ذا":1<0 عكزهخ). يوغان مكارني (صهطوه8 
12127 2). مارتن تشارلتون (0م تقطن صناتته]/8). تيم مكار قُْ (تإحاتتدنء81 دمذ1). حان 
ريجبي (إط18ظ د[)ء روب برادشو (50هط812035 20). آلان مور (ع21001 طداخ)؛ء دراش ماك 
دونشا (2تاعصده(1 8122 طاءةة(1): وجيم وايت (1171166 2ذ[). كما تلقيت ققد مفيدة أبها 
خلال العروض التقديمية في جامعة دورهام. وجامعة كلارك. وجامعة هارفارد. واهتمت رونا 
برادشوو (#تقطمل8:2 مصمط2) وأورلا دان (عصصنادآ 01212) بإدارة أعمال المكتب عندما كنت 
أحاول الانكباب على إجراء البحوث وكتابة الفصول. كما تفضلت جوستين جلسيون تاكن[ 
بإنتاج بعض الرسوم البيانية. فأنا مدين لكم ديعا بالعرفان. كما أود أيها شكر 
الكثير من الناس المشاركين على موقع التواصل الاجتماعي - التويتر وتغريداتهم التي أشارت إلى 
مواد مثيرة للاهتمام, وانخراطهم في مناقشات علمية دقيقة ذات صلة. وأخيراء الشكر موصول 
إلى كورا (0012) التي قامت بتثبيتي وقدمت قعوا راقع لي. 

وتم دعم جزء من الأبحاث التي أجريت في كتابة هذا الكتاب من خلال جائزة ال مجلس 
الأوروبي للبحوث المتقدمة, "المدينة المبرمجة" (.1112م,178 :323636- 1110-2012-8410 
6/1087 )) والتمويل المقدم من هيئة التعليم العالي في برنامج البحوث في المستوى 
الثالث للدورة الخامسة, والذي يهدف إلى إنشاء حاوية رقمية لأيرلندا. 

ويمكن الاطلاع على نسخة من مراجع الكتاب من خلال الرابط التالي: //:صاغط 
-.6022:67011110120011701021655. كما يجري بانتظام إضافة مصادر 
للمعلومات وتجارب حول ثورة البيانات على الرابط -عطا/ /أذ.حهم»ء107.5//:صاغط 
108121212216-117م. وبالطبع: فإن التعليقات والردود مرحب بها من خلال البريد 
الإلكتروني عأمستتاص © منطء 20.19 أو التغريد على حساب موقع التواصل الاجتماعي 
- تويتر © صتطءكاطاه1. 


لقد سبق نشر بعض ا مواد الموجودة في هذا الكتاب على شكل أوراق بحثية أو على 
النشرات اليومية» على الرغم من أنه قد تم تحديثهاء وإعادة صياغتهاء والتوسع فيها. ومنها: 
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تمهيد 


عطا ته دع00ء مناه تدع ل1 :عكنا آه وع0ه00' (2005) .1 رصتطء ك1 لصهد .31 ,عع1000 ٠‏ 
عأطه0مع1-ع صتاء 122 

851-17 :(230)6 رععهم5 220 تإاعن50 :0آ قستصصة[ط لخته خصع عدم عتحصظ ,1ه ٠‏ 

65 و,و6 02201111 :تإطصةتعمعع تتمتصتط لحته نه عذظ' (2013) .1 مستطء6ة1 ٠‏ 
ضذ وعناع101210 1و1 220 

٠ 11110312 308122 و3طم‎ 3)3(: 262-7. 

وتتقتطةط2نا اتهمطة له منهك ينظ #ترأك عصستناحلدء عطآ"” (2014) .1 ,صتطء ك1 ٠‏ 
1-14 :(79)1 1111221 0[0» © 

5 رقاقتطة دصى 2201م لنحته دعتع010ت7تعانامء ١8ع0‏ ,268 815 (2014) .1 رصتطء )19 ٠‏ 
(1)1 راع ك50 20ه 10262 

1-1 رعصنا[ لتم ٠‏ 

85 21 11535]111111165 103162 ,10263 القحدد (2014) .1 مالتتةأتتتدآ لتتهة .خآ رستطءعة1 ٠‏ 
ع1 .10264 

/132مء.تتاوو//نصاخط :5511 غ2 عاطهملتههة .1 عتعمهدط عسمكا:ه11 تن عاط ةتتصمععه:ط ٠‏ 
.8- 25112 

0©© ,0218 علط 01 2ع تنه طذ 262 القحدك' (ووعم صذ) .1 ,انمه تاهآ لصته .خآ مستطءعق1 ٠‏ 
تاه[ 

01 ه1دكتتطمعم عطا طات أعد. 1مك تدع كتد 1012م[ حصمة 0م1مه20 15 1.1 عتتسئة18 ٠‏ 
.25 1027104 

لهءه5 لطه لدع 55 عغط1' 4ه ددهأومتصمعم عطا طاتم1 0عع همع 15 1.2 عتتئة18 ٠‏ 
لطماء1 01 تجاعن50 7إخناوم1 

لتنة عذهكةطآ ملظ ,عتعدء5 [نع81 01 دزمأومتممعم عطا طنتم 0ع تاعصة كز 2.4 عاطة1]"' ٠‏ 
له 117001120 عط 1/1 

.051]01[7[15جء//نجاقط ,له أء 1817 101 ععطععنا 25متتصدمء عكتادعك 2 12062 ٠‏ 
2.17 

عكتادعك 2 لع0تنا /0.015/00تأتصططء 0تء جه // :خط حدم عع نلمنمع:؟ 15 3.1 عاطة[]' ٠‏ 


.1162 0115 لتتمطام»ء 


ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة, والبنى التحتية للبيانات, والنتائج المترتبة عنها 1 


تمهيد 


,135طتء 13115 آعقطء811 01 <زهأومتطمعم عط طنتمود 0ع0ساعصة 15 3.3 عاطه]' 
./مكطأ.ه غ0 ه55 //:صاغط 

أكتحطهمء1 عطص' .أكتستمصمعء8 عط]' 1ه ده أومتمطمعم عط طلخم لعع13لمممع؟ 15 4.1 عاطة]" 
ملع ]ناا تع جره مزوتوء2[1 

4 11 اء1ة]8 15510 ,ه1006 

.كع طامع]5 معتده/1 01 دمذدمتطمعم عط طاتو لعع0131منمع؟ 15 6.1 عتساعاط 

.كأعطة] لصه 1ه771ة1' 01 مأو تممتاعم عطا طخ 4عع1لممع؟ 15 6.1 ع1اطهة]' 
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ملاحظة: 


يُعبرَ عن مصطلح البيانات (2812) في هذا الكتاب في صيغة الجمع: مع استخدام 
مصطلح وحدة بيان (1026112) للدلالة على امثل المفرد (عع125622 512811131). بحسب ما 
هو موضح في قاموس أوكسفورد للغة الإنجليزية ((011 -تإتتهصمخ6ء11 امناعصظ8 0:4014): 

في اللغة اللاتينية, البيانات هي صيغة جمع لكلمة بيانء وتاريخياً وفي المجالات العلمية 
المتخصصة على الخصوص. يتم التعامل أيضاً مع مصطلح «البيانات» للدلالة على الجمع 
في اللغة الإنجليزية. حيث يأقٍ في سياق فعل الجمع (©775). كما في «تمّ جمع البيانات 
وتصنيفها». 

ومع ذلك. يستخدم هذا ال مصطلح على نحو متزايد في صيغة المفرد في وسائل الإعلام 
العامة والمحادثة اليومية. كما جرى تفصيل ذلك في قاموس أوكسفورد للغة الإنجليزية: 

ومع ذلك في العموم لا يجري التعامل مع مصطلح «البيانات» بصيغة الجمع في 
الاستخدام غير العلمي الحديث: ولكن بدلا من ذلك» يجرى التعامل معه كاسم إجمالي - 
للبند غير المعدود - على غرار كلمة «معلومات»». التي تأخذ الفعل بصيغة المفرد. وأصبح 
من المقبول في اللغة الإنجليزية القياسية على مدى عدد من السنوات وعلى نطاق واسع 
الجمل من قبيل: «تم جمع البيانات» في سياق فعل المفرد «89725». 

لذاء يتبع هذا الكتاب الاصطلاح العلمي المعمول به. ومع ذلكء تم إبقاء النص على حاله 
حيثما اتفق ورود استخدامه بصيغة المفرد عند الاقتباس. ودون الجدل في أي الصيغتين هو 
الأصح, فإن انحياز النحاة هو لصيغة فعل الجمع: ولكن الاستخدام العام الشائع هو أكثر 
انفتاحا ومرونة. 
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مقدمة: 

هناك تاريخ طويل للحكومات, والأعمال؛ والعلوم, والمواطنين فيما يتعلق بإنتاج واستخدام 
البيانات من أجل رصد العامء وتنظيمه, والانتفاع منه.ء وجعله أكثر محطقا وذا مغزى. وقد 
كانت البيانات في العادة مكلفة وسغرق وقنا ظويلا في الإنتاج والتحليل والتفسير وتوفر في 
العموم ضوزة قابنة غالبا مقوشة: وعرقة عن الظاهرة فين الدراسة. وفظرا للقذرة الدسمية: 
كانت البيانات ذات الجودة العالية سلعة ذات قيمة» وعلى هذا الأساس كان التكتم الشديد 
والحرص عليها وتداولها وتبادلها بأثمان باهظة. ولكن هذا الوضع بدأ يتغير بشكل جذري 
تماما. فالبيانات لم تفقد شيئا من قيمتهاء ولكن جرى في نواح أخرى تحول في طبيعتها 
وطرق إنتاجها من خلال مجموعة ما وصفها (1997) 115]62562ط0 بالابتكارات ال مربكة, 
والتي كلت هديا للوضع الراهن في كيفية إنتاج البيانات وإداراتها وتحليلها وتخزينها 
والاستفادة منها. فبدلاً من أن تكون البيانات نادرة ومحدودة ف قدرة الوصول إليها. غدت 
على نحو متزايد طرق إنتاج البباقاك #الظوفان؟ سنيلا غميقا وواسعا مخ البناقات المتنوكة 
ف طبيعتهاء وامرتبطة منطقيا: والمتوافرة عند الحاجة إليها في الوقت ال مناسب. وال منخفضة 
تنبا في التكلفة. وخارج نطاق الأعمال في طبيعتهاء مع تنامي فتحها وازدياد قابلية وسهولة 
الوصول إليها. فثورة البيانات جارية في الوقت الراهن. وهي تعمل بالفعل على إعادة 
تشكيل كيفية إنتاج المعرفة. وإجراء الأعمال» وحوكمة التشريعات والقوانين. 

لقد تأسست هذه الثورة في الموجة الأخيرة من تقنيات المعلومات والاتصالات (10:15)» 
وذلك من خلال عدد كبير من الأجهزة الرقمية التي نصادفها اليوم في المنازلء وأماكن 
العملء والأماكن العامة؛ كأجهزة الاتصال المحمولة, والحوسبة الموزعة» والحوسبة السحابية؛ 
ووسائل التواصل الاجتماعي؛ وإنترنت الأشياء (أجهزة ووسائل استشعار مترابطة ومتصلة 
من خلال الشبكة العالمية -الإنترنت). فهذه الوسائط والمنصات التقنية الجديدة أضحت 
تقود وتوجه أكثر من أي وقت مضى المزيد من جوانب الحياة اليومية - العملء والاستهلاك, 
والسفر والاتصالء والترفيه - وأضحت العوام التي نعيش فيها ثفهم بهيئة بيانات وتسير 
من خلال التقنيات ال معتمدة على البيانات. وعلاوة على ذلك. فإن هذه الوسائط وال منصات 
التقنية الجديدة تعمل ماديا ومنطقياً على إعادة تشكيل طرق إنتاج» وتداول» وتفسير 
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البيانات. وإنتاج ما اصطلح على تسميته «البيانات الكبيرة 0218 818». حيث كميات هائلة 
من البيانات الرقمية المتغيرة والمتنوعة» والتي من السهولة بمكان الجمع بينهاء وتبادلهاء 
وتوزيعها من خلال شبكات تقنية المعلومات والاتصالات» وتحليلها بواسطة جيل جديد من 
أساليب تحليل البيانات (وع"زلهدة 18:4) المعدّة لتتلاءم مع وفرة البيانات على العكس 
من ندرة البيانات المعتادة. ويتضح حجم طوفان البيانات الناشئة من خلال الادعاء بأنه 
"من فجر الحضارة وحتى العام 27٠0٠‏ أنتجت البشرية خمسة إكسا بايت (6اترطه:8) 
من المعلومات فقط؛ في حين نحن بصدد إنشاء القدر نفسه من البيانات كل يومين" (1121 
عاع 600 115 غأ20215مء» أعتك ,يصتمتته؟, مقتنئس من 2012 81501 ته هاه صرد). 

ولا تعد البياثات الكبيرة المكون الوحيد لقورة البيانات» فبالأخري كان هناك العديد 
من المبادرات المتصلة بعضها ببعض من قبيل التحول الرقمي (10181628602): ربط 
وتوسيع مجموعات البيانات المنتجة تقليدياً (البيانات الصغيرة) مع بعضها عبر بنى تحتية 
شبكية؛ وحركة البيانات المفتوحة التي تسعى لجعل أكبر قدر ممكن من البيانات متوفرة 
بشكل مفتوح للجميع للاستخدام؛ والهياكل المؤسسية الجديدة التي تسعى لتأمين المبادئ 
التوجيهية والسياسات المشتركة فيما يتعلق بأنماط تنسيق البيانات, ونماذج هيكلتهاء 
والبيانات الوصفية عنها. وحقوق الملكية الفكرية. وتراخيص الاستخدام القانوني لهاء ومعايير 
ا لمشاركة بها. وتشكل هذه المبادرات مجتمعة مجموعة من مجاميع البيانات الجديدة 
- مزيج من نظم الفكرء وأشكال المعرفة» والتمويلء والاقتصادات السياسية» والتشريعات 
الحاكمة والجوانب القانونية وامادية الناظمة, والبني التحتية: وا ممارسات. والمنظمات 
والمؤسسات. والمجتمعات المحلية والشخصيات الاعتبارية» والأماكن» والأسواق - التي تؤطر 
لكيفية إنتاج البيانات والحدود القصوى لاستخداماتها الممكنة. 

ويظهر أثر البيانات الكبيرة» والبيانات المفتوحة» والبنى التحتية للبيانات بشكل جلي 
في مجالات العلوم, وقطاع الأعمالء والقطاع الحكوميء والمجتمع المدني. فالتخصصات 
الجديدة التي تم استحداثها بدأت الآن بالتعامل مع تدفق البيانات الهائل بعد التعود 


على العمل في جزر البيانات المتفرقة» والسعي نحو استخراج المعلومات» واستخلاص النتائج 
من عدد قليل نسبيا من المشاهدات (2010 3611168 ..11). وقد اقترنت هذه التخصصات 
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بمجالات جديدة. مثل علوم البيانات (ع©»2ع ك5 1038): والحوسبة الاجتماعية ([ل5002 
8 والعلوم الإنسانية الرقمية (وع2216ددن11 21غ1ع1018): والعلوم الاجتماعية 
الحاسوبية (5وع©2عك5 50121 114200221م0012)): والتي تعنى بشكل واضح ببناء البنى 
التحتية للبيانات وإيجاد طرق مبتكرة لتحليل وفهم معنى البيانات عند توسعها وكبر 
حجمها. ففي قطاع الأعمالء توفر البيانات الكبيرة وسائل جديدة لإدارة جميع مناحي 
أنشطة الشركة بصورة مرنة وفعالة ويستفاد منها لتحقيق أرباح إضافية من خلال تعزيز 
الإنتاجية» والقدرة التنافسية: والمعرفة بالسوق. كما أضحت البيانات نفسها سلعة هامة, 
يتم شراؤها وبيعها مراراً في السوق العاللية بمليارات الدولارات. وبالنسبة للحكومات: وعلى 
نطاق واسع. توفر البيانات الديناميكية المتغيرة رؤى جديدة حول عملياتهاء فضلاً عن 
إعادة تشكيل وسائل الحكم وتنظيم المجتمع. فمن خلال تفحص قواعد البيانات امفتوحة, 
يستخلص المواطنون وا لمنظمات غير الحكومية (76©9) النتائج الخاصة بهم متحدين 
المنظمات التجارية الربحية والأجندات الحكوميةء ويقدمون رؤى بديلة للكيفية التي 
ينبغي بها تنظيم المجتمع وإدارته. 

لقد أثارت هذه الفرص الجديدة طفرة حقيقية ملموسة في ما يمكن تسميته ب "تعزيز 
البيانات" (11550ء]2005 1(28)؛ من خلال حشد الدعوات المبشرة بفوائد وآفاق البيانات 
الكبيرة» والبيانات المفتوحة. والبيانات الصغيرة الموسعة. والبعض من هذه الدعوات له 
ما يبرره» وبعضها الآخر مجرد غثٌ وتهويل دعا لا حقيقة له البتة. في المقابلء أصبحت 
مصطلحات: البيانات الكبيرة والبيانات المفتوحة» أنماطاً ثقافية قوية في الانتشار والتأثير 
(ميمات -1416265): وليست مجرد وسيلة لوصف البيانات ولكنها رمز لخطاب أوسع مدى 
يستخدم في حشد الدعم لها وانتشار اعتمادها والبدء في تطبيقها. فمع هذا الترويج 
والتعزيز أضحى من السهل الانجراف نحو تبني هذه المصطلحات دون انتقاد أو تمحيص 
للتغيرات التي تحدث والتي أثار العديد منها مخاوف أخلاقية. ومحاذير سياسية وقانونية. 
ورغم ذلكء. فقد كشف التاريخ فيما مضى عن سوابق من الابتكارات المربكة المتعلقة 
بالمعلومات - على سبيل المثال التحول الجذري في إنتاج المعرفة في أعقاب اختراع الطابعة. 
ومن حيث الواقع. فقد صاحب بداية كل ع صر جديد من العلم تقنيات جديدة أدت إلى 
زيادة مفرطة في البيانات وكانت ممثابة شرارة التحول نحو طرق جديدة لإنتاج» وتنظيم» 
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وتخزينء وتحليل. وتفسير البيانات (2000 102126052). على سبيل المثال. من ملاحظات 
(2012 563556): فإن الاستكشافات في عصر النهضة. والتي تعززت بفعل أدوات علمية 
أفضل في الملاحة. ورسم الخرائطء قد أسفرت عن كميات هائلة من الاكتشافات الجديدة 
التي أدت إلى وسائل جديدة للتصنيفء وتقنيات جديدة في التحليل والتخزينء وأفكار 
علمية جديدة. 

ونظراً للمرحلة المبكرة نسبياً في ثورة البيانات الحالية» فإنه ليس من المؤكد تماماً كيف 
ستتكشف وتستقر التحولات الحالية» وما الذي سيكون عليه نطاق عواقب التغيرات التي 
تحدث من منظور أوسع. فالواضح هو أن هناك حاجة ملحة محاولة الإدراك والشعور بما 
يحدث. وهكذاء فإن الهدف من هذا الكتاب هو تقديم إجمليء وتحليل مبدثي ودفيق 
للبياناف وثورة البرانات الساوية اليا قية! الكتال و صى :هق حية ليان فى الظرف 
والوسائل المتعلقة بإعادة تشكيل إنتاج ومعالجة وتحليل وتبادل البيانات: وما يعنيه هذا 
لكيفية إنتاج واستخدام المعلومات والمعرفة؛ وهو من جهة أخرى بمهد للنقاش والتفكير 
النقدي حول البيانات: طبيعتهاء وكيفية تأطيرها من النواحي الفنية والفلس فية والأخلاقية 
والاققضافية والفعميعات النقية واللؤسسية اللعيطة بها زيدلا مق أن #تعدى قوائن 
البيانات الكبيرة, والبيانات المفتوحة» والبنى التحتية للبيانات من خلال حالة عاطفية, أو 
نقد لاذع يشجب نتائج العواقب الأكثر سلبية لهاء يقدم الكتاب تشبييها تقديا ضيه 
للتغييرات التي تحدث. 

ويستند التحليل المقدم في هذا الكتاب على مشاركة واسعة النطاق مما سبقه من 
مؤلفات في مختلف العلوم: والعلوم الإنسانية, والعلوم الاجتماعية. ومن مطبوعات الثقافة 
الشعبية: والإصدارات الصحافية: والدوريات الصناعية. وعلى خبرة مباشرة في العمل على 
أنظمة حفظ أرشيفية وبنى تحتية ومشاريع تحليلات لبيانات على نطاق مؤسسي واسع. 
وينقسم الكتاب إلى أحد عشر فصلاً. يقدم الفصل الأول لمحة عامة ونقداً فكرياً حول 
مفهوم البيانات وكيفية فهم قواعد البيانات والبنى التحتية للبيانات. ويبحث الفصل 
الثاني في الدور المستمر للبيانات الصغيرة والكيفية التي تمّ بها توسيع نطاقها إلى أرشيفات/ 
محفوظات رقمية وبنى تحتية» إلى أن وصلت إلى درجة التداول وبيعها من خلال وسطاء 


11 ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها 


تمهيد 


البيانات. كما يناقش الفصل الثالث الدافع للتوجه نحو استحداث البيانات المفتوحة 
والبيانات المرتبطة التي يجري تقاسمها ومشاركتها وإعادة استخدامها على نطاق أوسع 
بمرور الوقت. ويبين الفصلان الرابع والخامس طبيعة البيانات الكبيرة بالتفصيل وعوامل 
التمكين للبيانات الكبيرة ومصادرها المساعدة على انتشارهاء في حين يقدّم الفصل السادس 
طحة عامة عن مجموعة جديدة من تحليلات البيانات التي ترمي إلى فهم البيانات الصغيرة 
الموسعة والبيانات الكبيرة. كما يدرس الفصلان التاليان (السابع والثامن) الحجج ال مستخدمة 
لتعزيز البيانات الكبيرة والترويج لها وبيان تأثيرها في الحوكمة والأعمال, والسبل التي تقوم 
بها ثورة البيانات على إعادة تشكيل كيفية تصور البحوث وممارستها. ويناقش الفصلان 
التاسع والعاشر التحديات التقنية والتنظيمية, والأخلاقية. والسياسية. والقانونية لثورة 
البيانات. ويحدد الفصل الأخير بعض الاستنتاجات الكلية ويقدم خارطة طريق لإجراء 
المزيد من البحث والتاصيل. 
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الفصل الأول 
تصور لمفهوم البيانات (122)2 وصتئتلهنامععممى) 


يتم فهم البيانات عادة على أنها المادة الخام التي تنتجها طرق تجريد العوالم من حولنا 
والتعبير عنها من خلال فئات» ومقاييس» وأشكال تمثيلية أخرى - كالأرقام, والحروف. 
والرموزء والصورء والأصوات. والموجات الكهرومغناطيسية: والثنائية الرقمية - تشكل اللبنات 
الأساسية في بناء صروح المعلومات والمعرفة. ومع أن البيانات تعد بطبيعتها مُعبرة ومُمثلة 
للأشياء (على سبيل المثالء القياسات المتعلقة بظاهرة ما كعمر الشخص.ء طوله: وزنه» لونه.» 
ففظ ذنم ريه عاذاتة مكاق إقاسه هَمَا إل ذلك إلا أنه مد الممكن أن تكوق أيضا 
ضمنية (من خلال الغياب بدلاً من الوجود)» أو مُشتقة على سبيل المثال: البيانات الني يتم 
إنتاجها من البيانات الأخرى كالنسبة المئوية للتغير مع مرور الوقت والتي يتم احتسابها 
من خلال مقارنة البيانات من فترتين زمنيتين مختلفتينء ويمكن أن تكون البيانات مسجلة 
ومُخزنة إما في شكل تناظري (42108) أو من خلال ترميزها في شكل رقمي كأرقام ثنائية 
(8148). وتتصف البيانات بأنها ذات جودة جيدة إذا كانت منفصلة وواضحة بمعنى أن 
تكون كل وحدة بيان (1026312) مفردة, ومستقلة وقابلة للانفصال. ومعرفة بشكل واضح. 
وتراكمية قابلة للحصر (يمكن أن تبنى في مجموعات). ومرتبطة ببيانات وصفية لها (بيانات 
عن البيانات)» ويمكن ربطها بمجموعات بيانات أخرى لتقديم رؤى وأفكار غير متوفرة من 
مجموعة بيانات واحدة (2013 11056256618). وتتمتع البيانات باستخدام قوي وقيمة 
عالية كونها توفر المدخلات الأساسية لكافة مراحل التحليل التي يجري توظيفها من قبل 
الأفراد. والمؤسسات, وقطاعات العلوم والأعمال لفهم وتفسير العام الذي نعيش فيه. والتي 
تستخدم بدورها لاستحداث الابتكارات: المنتجات: السياسات. والمعارف التي تشكل الكيفية 
التي يعيش بها الناس حياتهم. 

ومن هناء تعد البيانات مورداً رئيسياً في العصر الحديث. ومع ذلك ونظراً لفائدتها 
وقيمتهاء ومقدار الجهد والموارد المخصصة لإنتاجها وتحليلهاء فمن اللافت للنظر كيف تم 
إيلاء القليل من الاهتمام للتصور المفاهيمي والإدراك المبدئي للبيانات في حدّ ذاتها. وفي 
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المقابل» هناك الآلاف من المقالات والكتب المكرسة لفلسفة ال معلومات والمعرفة. فكما أننا 
نميل في العادة للتركيز على المباني والأحياء عندما ننظر إلى المدنء بدلاً من الطوب والإسمنت 
المستخدم في بنائها. فكذلك هو الحال مع البيانات. وعلاوة على ذلكء وبامثلء كما اعتدنا 
التفكير بالطوب والإسمنت بصفتها مجرد وحدات بنيوية بدلاً من عناصر تم تصنيعها داخل 
مصانع من قبل شركات ملزمة ضمن اعتبارات لوجستية ومالية وقانونية» وأنه يتم توزيعها. 
وتخزينهاء وتداولهاء كذلك حالنا إلى حد كبير في التعامل مع البيانات. ونتيجة لذلكء وعندما 
تكون البيانات هي محور التساؤل والاهتمام, عادة ما يتم النظرء بالمعنى التقني إلى حد 
كبير, إلى الكيفية التي ينبغي بها إنتاج وتحليل البيانات» أو الكيفية التي يمكن بها الاستفادة 
منها في إنتاج رؤى وقيم. وليس زيادة النظر في طبيعة البيانات من منظور مفاهيمي 
وفلسفي. 

ومع الأخذ بهذه الملاحظة في الاعتبارء فإن الهدف الرئيسي من هذا الكتاب هو مركب 
ثلائي الأبعاد. فيه: توفير شرح تفصيلي عن طبيعة البيانات ومجاميعها على نطاق أوسع؛ 
وإيضاح الكيفية التي تتحول فيها هذه ال مجاميع وتتحور مع تطوير بنى تحتية جديدة 
للبيانات. والبيانات ا مفتوحة» والبيانات الكبيرة؛ والتفكير ا معمق في الآثار المترتبة عن هذه 
المجاميع الجديدة للبيانات فيما يتعلق بكيفية استشعر العام المحيط بنا والتعاطي معه. 
ولتوفير منهاج مفاهيمي وتصور مبدثئي أولي. سيتم في هذا الفصل فحص أنماط البيانات 
وأطرها.ء وطبيعتهاء والقواعد الفلسفية لها بالتفصيل. وبعيداً عن كونها وحدات بنيوية 
سيطظة كقف المناققة عن أن البيانات أكة تعقب دا هيا كنا نظلن. ففي حين يقبل 
العديد من المحللين البيانات على ظاهرها. ويعاملونها كما لو أنها محايدة وموضوعية 
فقائلة مسيقا للتخمين والتحليل في طبيعتها. إلا أن البيانات مؤطرة في الواقع من الناحية 
الفنية. والأخلاقية, والاقتصادية:. والزمانية» والمكانية» والفلس فية. فالبيانات لا يمكن أن 
توجد بشكل مستقل عن الأفكارء والأدوات: والممارساتء والسياقات,. وا معارف المستخدمة 
لإنتاجهاء وبعالجنهاء وتحليلها (2013 مك2[ 220 صسهحصاعء01 :2005 مععاهده 8) . ولذاء 
فإافانتجة القددة هي أن فهم اليانات وكورة النيانات الجازية حاليا ينظلي تهلياة كار 
دقة من ذلك الذي تستعرضه الكثير من الأدبيات ذات الصلة بالبيانات المفتوحة والبيانات 
الكبيرة في وقتنا الحاض. 
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ماهية البيانات: 
بشكل اشتقاقيء فإن كلمة البيانات «1(268» مشتقة من الكلمة اللاتينية «ع15ة(1». 
التي تعني «أن تعطي». وبهذا المعنى» فإن البيانات هي عناصر خام يمكن استخراجها من 
أو تعطى بواسطة ظاهرة معينة يجري قياسها وسجيلها بطرق مختلفة. ولكن البيانات 
تشير في الاستخدام العام إلى تلك العناصر التي تؤخذ وتّستخرج من خلال الملاحظات, 
والحساباتء والتجارب. وحفظ السجلات (2007 2هددعوءده8). أما من الناحية الفنية, 
فما نفهمه من بيانات أنها في الواقع التقاطات «8]م08» والمشتقة من الكلمة اللاتينية 
«56»م03»» والتي تعني «الأخذ»؛ أي تلك الوحدات من البيانات التي تم اختيارها 
وانتقاؤها من مجموع كل البيانات ال محتملة (2011 »12008 لصه صنطء)1؟1). كما قال 
(1950: عتذر مقتبس من 2562ع[ (278 :1952 #عكاءء 82 : 
كان حادثاً مؤسنفا في التاريخ أن يستخدم المصطلح بيان «2د6ة10» بدلا من 
مصطلح لقطة «6112م2ن0» للدلالة على وصف وحدة الظاهرة في العلوم.ٍ وهي 
ليست المناولات العلمية التي منحتها الطبيعة للعام» ولكن المناولات التي أخذت 
أو انتقيت من الطبيعة من قبل العالم نفسه وفقا لهدفه. 
من ثم.ء وبال معنى الدقيق للكلمة» ينبغي على الكتاب أن يُعنون بثورة اللقطة 
«2 17011110 مدن عط1». ومع ذلكء. ولأن مصطلح البيانات «10068» قد أصبح 
متأصلاً في لغة الاستخدام الأكاديمي وقطاع الأعمال لتعني اللقطة «مامهن0)» وبدلا 
من الخلط واللغط أكثر في هذه المسألة فمن ا منطقي المتابعة والاستمرار في استخدام 
مصطلح البيانات «1268» مع أن اعتماد مصطلح اللقطة «8]م02» أكثر ملائمة في 
الاستخدام. وبعد تجاوز تسليط الضوء على جذور الاشتقاق اللغوي لهذا ال مصطلح, 
فإن هذه المناقشة الوجيزة تبدأ في تسليط الضوء على أن البيانات التي يتم جمعها 
من خلال القياس هي دائماً لمجموعة منتقاة من مجموع كل البيانات المحتملة - 
والتي اخترنا التقاطها من كل المعطيات الممكنة. وعلى هذا النحوء تكون البيانات 
جزئية بطبيعتهاء انتقائية. وممثلة. مع أهمية ال معايير المميزة ا مستخدمة في التقاطها. 
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وقد لاحظ علماء آخرون أن ما تم فهمه على أنه «البيانات» قد تغير مع مرور الزمن 
وتطور العلم. فقد بين (2013 عع طدء205) بأن مصطلح «البيانات» استخدم لأول مرة 
باللغة الإنجليزية في القرن السابع عشر. وارتبط كمفهوم إلى حد كبير بالحداثة والنمو 
والتطور المصاحب للعلوم: والطرق الجديدة في إنتاج» وعرضء ومناقشة امعرفة في القرنين 
السابع عشر والثامن عشر والتي انتقلت بعيداً عن اللاهوت, والوعظء والعواطف إلى 
الحقائق والأدلة واختبار النظرية من خلال التجربة :2013 بإع2ة© :1998 بوعتدووط) 
(2013 18ءطمء805. ومع مرور الوقتء جاء فهم البيانات على أنها سابقة للتحليل 
وهي ما قبل اتخاذ صفة الواقعية, وتختلف في طبيعتها عن الحقائق, والأدلة» وا معلومات, 
وا معرفة» ولكنها عنصر مؤسس في تكوين جميع هذه العناصر على الرغمء في الغالب. من 
اختلاط التعاريف وال مصطلحات المستخدمة في وصف البياناتء الحقائق» الأدلة: المعرفة, 
والمعلومات بحسب ما أشار إليه (18 :2013 وأ طد»ء8205) حين ذكر أن: 


الحقائق وجودية ([هءنعه1هغم0). والأدلة معرفية (توعه10مصعئوام8)ء 

والبيانات بلاغية (21ع11©]6011). وتكون وحدة البيان «1060112» حقيقة أنشاء 

كما قد تكون الحقيقة في واقع الأمر دليلاً.... على أن وجود وحدة البيان «دد126» 

يعد مستقلاً دون أي اعتبار للحقيقة الوجودية المقابلة (8ظتلهموعء011 © 

طأنام!' لهءزع02:010). وعند نفي الحقيقة وإثبات عدم صحتهاء فإنها تتوقف 

عن كونها حقيقة. فالبيانات الكاذبة هي بيانات مع ذلك. 

وبحسب المصطلحات /التعابير البلاغية» فالبيانات هي تلك التي توجد قبل النقاش أو 
التفسير الذي يحولها إلى حقائق: وأدلة» ومعلومات (2013 105650618). ومن هذا المنظور, 
تحمل البيانات مفاهيم مميزة: فهي تكون بذلك مجردة» ومنفصلة» وتراكمية (يمكن الجمع 
بينها) (2013 ع:نهطادء5ه8). وذات معنى مستقل عن الشكلء واللغة, واممنتج لهاء والسياق 
(بمعنىء أن تحمل البيانات معناها سواء تم تخزينها بصورة تناظرية (42108) أو رقمية 
(121نع21). أو تم عرضها على الورق أو الشاشة أو تم التعبير عنها بأية لغة, أو تم تقييدها 
بأنماط محددة غير متغيرة. مثل إشارة عدد الحلقات في جذوع الأشجار لعمر الشجرة والذي 
يكون دوماً مساوياً له) (1101412010). ويؤكد (810:1012008) أن دعم استقلال البيانات 
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قائم على ثلاثة أنواع من الحيادية هي: التصنيفية (ع21ةده2:ة1) كون البيانات تمثل كيانات 
علائقية معرفة تحدودا بالنسبة إلى بيانات خاصة أخرى؛ والطوبوغرافية (لهعذع010م19) 
لأنه يمكن للبيانات اتخاذ أشكال مختلفة منفصلة بعضها عن بعضء على سبيل المثال» 
الشكل الأساسيء الثانوي. الوصفيء التشغيلي, والمشتق؛ والجينية (©662661) كون البيانات 
تمتلك دلالات مستقلة عن مدى فهمهاء. فعلى سبيل امثال. تشكل الهيروغليفية على حجر 
الرشيد بيانات بغض النظر عن حقيقة أنه عند اكتشافه م يمكن لأحد أن يفسرها. 

وفي واقع الأمر ليس كل من يفكر أو يشتغل بالبيانات يحمل هذه النظرة البلاغية 
الضيقة. ففهم البيانات لم يتطور مع مرور الوقت فحسب. بل اختلف هذا الفهم بحسب 
منظور الفهم ووجهة النظر للبيانات. على سبيل المثالء أوضح (51021012008) أن البيانات 
من المنظور المعرفي هي مجموعات من الحقائقء ومن المنظور ال معلوماني البيانات هي 
معلومات. ومن منظور الحوسبة التقنية البيانات هي مجموعات من العناصر الثنائية التي 
يمكن معالجتها ونقلها إلكترونيا ومن المنظور العام 1:هطمهذ) البيانات هي عناصر 
مجردة بتميز واضح وملموس من البيانات الأخرىء ففي الحالة الأولى؛ توفر البيانات الأساس 
مزيد من الاستدلال أو تشكل الأدلة التجريبية. وفي ال مجموعة الثانيةء تشكل البيانات 
معلومات تمثيلية/ممثلة يمكن تخزينها ومعالجتها وتحليلها. ولكن لا تشكل بالضرورة 
حقائق. أما في المجموعة الثالثة» فتشكل البيانات المدخلات والمخرجات من الحوسبة ولكن 
ينبغي معالجتها لتحويلها إلى حقائق ومعلومات على سبيل المثال. يحتوي القرص الرقمي 
المدمج (19772) على غيغابايت من البيانات» وهي ليست وقائع أو معلومات بحد ذاتها 
(فلوريديء .)3٠١0‏ ف المنظور الرابع» تكون البيانات ذات مغزى لأنها التقاط ودلالة على 
التنوع والتغيير على سبيل المثال, أنماط من النقاطء والحروف الأبجدية والأرقام, والموجات 
الطولية التي تقدم إشارة يمكن تفسيرها. وكما هو مبين أدناه. قد يشمل فهم البيانات 
مناظير أخرى مثل الفهم القائم ان اغفبان الببانات يناد لحتماعيا. أو امتلاك الينانات هود 
0 أو تحميلها مضامين إيديولوجية» أو اعتبارها سلعة يتم تداولها الاتجار بهاء أو أنها 
تشكل منفعة عامة» وغير ذلك من المفاهيم الموجودة. والنقطة الأساسية هناء أن البيانات 
ثم تكن أبدا ببساطة مجرد بيانات. حيث تختلف الكيفية التي يتم فيها تصور البيانات 
واستخدامها من قبل أولئك الذين يجمعونء ويحللونء ويستخلصون النتائج منها. 
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أنواع البيانات: 

سواء كانت البيانات بطبيعتها قابلة للتخمين (تم التكهن قبل التحقق منها) ومطابقة 
بلقباً أو لقنن الواضت أن الببانات متنوعة ق خصائصهاء مما يحنده عبارات واضحة 
كيقية العحامل معها وما مكن القباه به مق بخلالها:: ووصفة عامة) فخداف البياناك دسب 
النموذج (النوعي أم الكمّي). والهيكل (المنظم, أو شبه المنظم, أو الغير منظم)» والمصدر 
(مسجّلة. أم مشتقة, أم مستنفذة, أم عابرة) والمنتج (رئيسي: أو ثانويء أو عام) والنوع 
(بيانات تأشيرية: أو بيانات خاصية. أو بيانات وصفية). 


البيانات الكمية (10262 ©00121162135)) والبيانات النوعية (122162 1217 11لهن0): 

من الممكن أن تتخذ البيانات العديد من الأشكال المادية متضمناً ذلك الأرقام, والنصوص, 
والرموزء والصورء والصوت. والموجات الكهرومغناطيسية: أو حتى الفراغ أو الصمت (فالفضاء 
الفارغ هو في حدٌ ذاته بيانات). وتنقسم هذه البيانات في العادة إلى فئتين رئيسيتين: 
البيانات الكمية والبيانات النوعية» فالبيانات الكمية تتكون من سجلات رقمية. وبشكل عام 
تكون هذه البيانات واسعة النطاق وتتعلق بالخصائص الفيزيائية للظواهر (مثل الطول, 
الارتفاع» المسافة, الوزن» المساحة» والحجم). أو تكون تمثيلية وتتعلق بالخصائص غير المادية 
للظواهر (مثل الطبقة الاجتماعية: المستوى التعليميء الحرمان الاجتماعي: وتصنيفات 
مستوى المعيشة). وللبيانات الكمية أربعة مستويات مختلفة للقياس والتي تحدد كيفية 
معالجتها وتحليلها (1999 6غ12' له صنطء) 13 وانظر ما الجدول .)١-١‏ ويمكن تحليل 
هذه البيانات باستخدام العروض المرئية». ومجموعة متنوعة من طرق الإحصاء الوصفي 
والاستدلاليء وتستخدم باعتبارها مدخلات للنماذج التنبؤية ونماذج المحاكاة. 


ف ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة, والبنى التحتية للبيانات, والنتائج المترتبة عنها 


البيانات الاسمية 
البيانات النظامية الترتيبية 
(دغهك لهستل 0) 


بيانات الفترة (أو المسافة) 
(وغهك لمحتعغم1]) 


البيانات النسبية 
(مخهك متخنه]) 


)١-١( الجدول‎ 


مستويات قياس البيانات 


ترتب المشاهدات في فئات منظمة. حيث 
بعض المشاهدات هي أكبر من غيرها. 


تمتد القياسات على طول مقياس يتضمن 
الفترة أو المسافة بين نقطة أصل ثابته 
وأخرى متغيرة. ولا تتغير طبيعة فترة 
المشاهدات في هذا النوع من القياسات 
عند الإضافة أو المضاعفة بمقدار ثابت. 
ويمكن أن تكون قيمة البيانات متصلة 
(على سبيل المثال» الوقت أو الطول) أو 
منفصلة /متقطعة (على سبيل ال مثال. عدد 
مرات المشاهدة) في الطبيعة. 

ممائلة لبيانات الفترة عدا أنها ذات 
نقطة أصل صفرية حقيقية. كما أن 
المضاعفة بمقدار ثابت لن تغير الطبيعة 
النسبية للمشاهدة. 


تصور لمفهوم البيانات 


غير متزوج» متزوج» مطلق» 
أرمل 


درجة الحرارة 
على المقياس المئوي 


(علهءة متتأقاعن). 


علامة الاختبار على مقياس 
من صفر- ٠٠١‏ 





وفي المقابل. فإن البيانات النوعية هي بيانات غير عددية» مثل النصوصء الصور, الفن» 
الفيديىو الأصوات» والموسيقا. وبرغم أنه مكن قعويل الببانات التوعبة إل مانات كسة 
[لاأن ذنك حضون حتفا وتعريدا كتيرين تغسحارة لقراء البياخات الأصررة سيجة العداة 
التحويل. ولذاء فإن عملية تحليل البيانات النوعية تمارس في العادة على المواد الأصلية» سعياً 
لاستخلاص وبناء المعنى والفهم بدلاً من إخضاع البيانات ومجرد إمرارها لتقنيات حاسوبية. 
ومع ذلكء فقد تم إحراز تقدّم كبير فيما يتعلق بمعالجة وتحليل البيانات النوعية حاسوبياً 
من خلال عدد من التقنيات مثل التعلم الآلي والتنقيب في البيانات (انظر الفصل السادس). 
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الفصل الأول 


البيانات المنظمة (10268 0ع1011]ء5]33).: والبيانات غير المنظمة (1(262 0ع12أعناأومل1])ء 
والبيانات الشبه المنظمة (102162 0ع11111اد-تصاء 5): 

البيانات المنظمة هي تلك البيانات التي يمكن تنظيمهاء وتخزينها. ونقلها بسهولة من خلال 
وم بيانات محدد, مثل قائمة الأرقام والنصوص الواردة في جدول أو قاعدة بيانات علائقية 
ذات تنسيق ثابت موحد (على سبيل المثال الاسم تاريخ الميلادء العنوان» الجنس.... إلخ). 
ويمكن معاابة هذه البيانات. والبحث فيهاء والاستعلام عنهاء والجمع بينها. وتحليلها بشكل 
مباشر نسبيا باستخدام حساب التفاضل والتكامل والخوارزميات. كما يمكن تمثيلها صوريا 
باستخدام أشكال مختلفة من الرسومات البيانية والخرائطء ومعالجتها بسهولة من قبل 
أجهزة الحاسب الآلي. أما البيانات الشبه المنظمة فهي بيانات ذات تنظيم/ هيكل فضفاض 
وليس لها نموذج أو مخطط مسبقء ومن ثم لا يمكن تقيبدها ضمن قاعدة بيانات علائقية. 
وتكون بنية البيانات الشبه المنظمة غير متسقة. وضمنية» ومرنة» وغالبا ما تتداخل في 
شبكة ذات شكل هرميء ولكنها في ذات الوقت ت: فوع مسبوغة مفسقة بفتكل كبر هن 
حقول البيانات» ويتم تمييز كل منها بوسم مميزء ومن ثم يمكن فصل المحتوى بصورة دلالية 
وتوفير بيانات وصفية ذاتية التعريف بصورة مرنة واستخدامها وسيلة لفرز وترتيب وهيكلة 
البيانات. ومن الأمثلة على البيانات شبه ال منظمة صفحات الويب الموسومة بلغة التوصيف 
اموسعة (211غ1 -ء281128هآ من11211 عا تومءعغ«8) وهي الصفحات التي تستخدم لغة 


التوصيف الموسعة (.16011) لتنسيق وترميز ا مستندات بصورة قابلة للقراءة آليا دقري في 
آن واحد؛ 2012 وكلصه8؛ انظر البيانات المرتبطة في الفصل الثالث). 


في المقابلء لا تمتلك البيانات غير المنظمة نموذج بيانات محدّداً أو هيكلاً تعريفياً مشتركا. 
ولكن قد يكون لكل عنصر على حدة شكل أو هيكل محدّد خاص به مثل عناصر النص 
الروائي أو الصورة: ولكن ليس كل البيانات ضمن مجموعة البيانات لها الهيكل نفسه. 
على هذا النحوء وبينما يمكن في الغالب البحث والاستعلام عن البيانات غير المنظمة: إلا 
أنه ليس من السهل الجمع بينها وتحليلها باستخدام الحاسب الآلي. وتكون البيانات غير 
ا لمنظمة نوعية بطبيعتها. ولكن من ا ممكن في أغلب الأحيان تحويلها إلى بيانات منظمة 
فق خلال الفرة والتضديف., وحتى وقت قربي لشبياء كانت مجموعاف البيانات الكبيرة 
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تصور لمفهوم البيانات 


جداً تحوي في العموم بيانات منظمة كونها أسهل بكثير في المعالجة والتحليل والتخزين 
على هذه الحال. أما في عصر البيانات الكبيرة» فقد تكونت العديد من مجموعات البيانات 
الضخمة التي تحوي بيانات شبه منظمة أو غير منظمة: مثل التي أنتجتها المشاركات 
الاجتماعية الجماعية على مواقع التواصل الاجتماعي مثل الفيسبوكء التغريدات على تويتر 
الصور ومقاطع الفيديو ا مرفوعة على الشبكة العالمية» والمدونات (81085)» إذ تشير بعض 
التوقعات إلى معدل زيادة في نمو هذه البيانات غير المنظمة أو الشبه المنظمة بمقدار خمسة 
عشر يفا عن البيانات ال منظمة (2012 .21 © 11105وم7110). وقد صاحب ذلك تطور 
في تصميم قواعد البيانات مثل قواعد البيانات غير العلاقية :1 71050) والتي لا تستخدم 
النماذج الجدولية أو قواعد البيانات العلائقية, انظر الجدول رقم 0)» وتقنيات التعلم الآلي 
التي تساعد في التخزين والتحليل (انظر الفصل السادس). 


البيانات الملتقطة (1(22 0ع:1111م02)).: والبيانات المستنفدة/ المستهلكة 
(12262 غ1154جطاء:ظ)ء والبيانات العابرة (10262 15251621): والبيانات المشتقة / 
المستمدة (10262 0ع215نء12): 

هناك طريقتان رئيسيتان لإنتاج البيانات: الأولى هي أنه من الممكن الحصول على 
البيانات بصورة مباشرة من خلال شكل من أشكال القياس مثل الملاحظة: والمسح اطيداني» 
والتجارب المخبرية والميدانيةء وحفظ السجلات (على سبيل المثالء ملء الاستمارات أو كتابة 
امدونات)» والكاميرات, وال ماسحات الضوئية, وأجهزة الاستشعار. وفي هذه الحالات. عادة 
ما تكون البيانات هي انتج المطلوب للقياس؛ أي أن النية هي إنتاج بيانات مفيدة. وفي 
المقابل» يتم إنتاج البيانات المستنفدة بالأصل بواسطة جهاز أو نظامء وتكون ناتج وظيفة 
رئيسية وليست المخرج الرئيسي (2011 .21 © 118إ112). فعلى سبيل المثال» فإن جهاز 
تسجيل الخروج الإلكتروني المصمم لاحتساب إجمالي البضائع التي تم شراؤها ومعالجة 
عملية الدفع لها من الممكن أن ينتج كذلك بيانات تستخدم مراقبة المخزونء وأداء العاملين, 
وعمليات شراء العملاء. وتنتج العديد من الأنظمة ا محوسبة مثل هذه البيانات المستنفدة 
والتي أصبح الكثير منها مصدراً قيماً للبيانات. وفي حالات أخرىء فإن البيانات المستنفدة 
تبقى بيانات عابرة بطبيعتها؛ أي أنه لم يسبق أن جرى فحصها أو معالجتها ولذا فإنه يجري 
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الفصل الأول 


التخلص منهاء إما لأنها ضخمة جداً أو غير منظمة بطبيعتهاء أو مكلفة في المعالجة والتخزين, 
أو أنه يوجد نقص في تقنيات استخلاص القيمة منهاء أو لقلة الاستخدام الإستراتيجي أو 
التكتيي لها (2012 دكلصة8 :2012 .21 أ» 13105همم7211). ومن الأمثلة على ذلك ما ذكره 
(3 :2011) .21 أ معلاتوصه31 من أن "مقدمي خدمات الرعاية الصحية.... يتجاهلون 75١‏ 
من البيانات التي ينتجونها (كالفيديوهات المسجلة أثناء العمليات الجراحية)". 


وتعد البيانات الملتقطة والبيانات المستنفدة بيانات «خام» بمعنى أنه لم يتم تحويلها أو 
ضمّها مع غيرها من البيانات. وفي المقابلء يتم إنتاج البيانات المشتقة من خلال عمليات 
إضافية من المعالجة والتحليل للبيانات التي تم التقاطها. فعلى سبيل المثالء قد تكون 
البيانات هي تعداد حركة الأفراد على أحد التقاطعات المرورية والبيانات المشتقة منها هي 
التعداد الإجمالي أو التعداد لكل ساعة. فالبيانات الأخيرة استمدت من البيانات السابقة. 
وتكون البيانات التي جرى التقاطها في كثير من الأحيان مدخلاً إلى نموذج العملية في حين 
تكون البيانات المشتقة هي المخرج عن نموذج العملية. فعلى سبيل المثالء قد تكون بيانات 
الكثافة المرورية مدخلاً إلى نموذج النقل والمواصلات على أن يكون المخرج هو بيانات التوقع 
أو المحاكاة (مثل حساب حركة المرور المتوقعة في أوقات مختلفة أو في ظل ظروف مختلفة). 
ففي حال وجود نموذجء من المرجح أن تضم بيانات التعداد/ الكثافة المرورية مع بيانات 
أخرى ملتقطة أو مشتقة (مثل نوع السيارة. وعدد الركاب... إلخ) لإنشاء بيانات مشتقة 
جديدة قد تشكل مدخلا للنموذج. ويتمٌ إنتاج البيانات المشتقة لعدة أسبابء بما فيها 
الحدّ من حجم البيانات والتقليل منها إلى قدر مقبول من ال ممكن إدارته لإنتاج مقاييس 
أكثر فائدة وذات معنى. وفي بعض الأحيانء قد تتم معالجة البيانات الأصلية الملتقطة إلى 
مستويات مختلفة من الاشتقاق اعتمادا على الاستخدام المقصود. ويّعد نظام وكالة الفضاء 
الأمريكية - ناسا الخاص برصد ومراقبة الأرض من الأمثلة على ذلك حيث يقدم بياناته في 
ستة مستويات تبدأ من البيانات الملتقطة وغير المعالجة, وتمضى خلال درجات متزايدة 
من مستويات المعالجة والتحليل وصولاً إلى مخرجات النموذج القائمة على تحليل بيانات 
ا مستوى الأقل (2007 تتددمعء:ه8؛ انظر جدول .)١1١7‏ 
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تصور مفهوم البيانات 


)١-7( الجدول‎ 


المستويات الستة لبيانات نظام رصد ومراقبة الأرض الخاص بوكالة الفضاء الأمريكية 


مستوى البيانات 


امستوى بيانات غير منظمةء وغير معالجة بالدقة الكاملة وبالحالة الخام وتحوي 
كافة إضافات بيانات الاتصالات (على سبيل المثالء بيانات التزامن,» 
ترويسة الاتصالء البيانات المكررة) 

المستوى الأول أ بيانات غير منظمة: وغير معالجة بالدقة الكاملة. ولكن معنونة زمانياً 
ومذيّلة أو متبوعة بشروحات إضافية. تشمل معاملات معايرة ومقاييس 
راديوية وجغرافية ومؤشرات تحتسب وتضاف للبيانات في المستوى ٠‏ 
ولكن لا تطبق عليها. 


هي بانات المستوى الأول أ واكن ع معالجه إلى وحدات الاتشعار 


الأول 
المستوى الثالث مفشيراة لخ ينها ق مانيس تبك متغظمة [لفتراغ + الزمن اق 
العادة مع يعض اللكملات والتدقيق. على سلامقها 


المستوى الرابع مخرج النموذج أو النتائج من التحليل لبيانات المستويات الأقل 
(المتغيرات المشتقة من قياسات متعددة). 


المصدر: مقتبس من اللوقع الإلكتروني على العنوان : 


5ع 1-ع تتذووع» 1:0ج /وعع جاع ناع1ع:0262.11252.5077/0212/5]212021:05-210-1 طاعتةع //:وصراغخط 
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الفصل الأول 


البيانات الرئيسية (1228 7تودمةوط).: البيانات الثانوية (12268 201239<مء»5), 
والبيانات العامة (10262 «إتهنارء1): 

يتم إنتاج البيانات الرئيسية (الأساسية) من قبل الباحثين وأدواتهم من خلال تصاميم 
البحوث التي يضعونها. أما البيانات الثانوية فهي البيانات التي يتم إنشاؤها من قبل 
شخص ثم تتاح للآخرين لإعادة استخدامها وتحليلها. وعلى ذلكء يمكن أن تكون البيانات 
الأساسية لشخص ما هي بيانات ثانوية عند شخص آخر. أما البيانات العامة فهي شكل من 
أشكال البيانات ال مشتقة. مثل التعداد, والفئات, والنتائج الإحصائية, وتصدر البيانات العامة 
غالبا من قبل الوكالاث الاحضاقية. يدلا مق البثاقات القافوية لضماق السرية الأتتخاض 
الذين تشير إليهم هذه البيانات. على سبيل المثال» يحظر نشر البيانات الأساسية للتعداد 
السكاني الأيرلندي على أنها بيانات ثانوية إلا بعد مائة عام من إنتاجها؛ ولكن يتم الإفراج 
عن البيانات على صورة ملخصات إجمالية وبيانات تصنيفية عامة. ويسعى العديد من 
الباحثين والمؤسسات لإنتاج البياكات الأننامية لأنها مضي افيه لاحتياجاتهم الخاصة 
ومركز عليها. في حين لا تتوفر خيارات التصميم هذه لأولئك الذين يقومون على تحليل 
البيانات الثانوية أو العامة. وعلاوة على ذلك. على أولئك الذين يستخدمون البيانات 
الثانوية والعامة كمدخلات في دراساتهم الخاصة أن يتوثقوا من صلاحية البحث الأصلي 
وصحته. 

ويجمع الباحثون في كثير من الأحيان بين البيانات الأساسية والبيانات الثانوية والعامة 
لإنتاج بيانات مشتقة ذات قيمة أكبر. على سبيل المثال» قد تسعى متاجر التجزثة لإنشاء 
مجموعة بيانات مشتقة تدمج بيانات المبيعات الأساسية مع البيانات السكانية الجغرافية 
العامة (8غ012 وعنطاصةع0<ع0معع :1621217): وهي بيانات عن أي نوع من الناس الذين 
يعيشون في مناطق مختلفة والمستمدة من التعداد السكاني والبيانات العامة والتجارية 
الأخرى من أجل تحديد أماكن لاستهدافها بالمواد التسويقية. إن البيانات الثانوية والعامة 
ذات قيمة لأنها تمكن من إجراء الدراسات التكزادية ويماء تحموهاض اناك أكر حهها 
وأكثر ثراء وتعلنيكا. وهي تنتج لانقا ما أطلق عليه (2012 .21 © 2م]متتة02) مصطلح 
تضخيم البيانات (2)102ء2تامجسم 2 والذي يعني أن الجمع بين البيانات يتيح رؤى 
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أكبر بكثير من خلال الكشف عن الروابطء العلاقات: والأنماط التي تبقى خافية في حال 
ظلت البيانات معزولة» ونتيجة لذلكء. فإن بيانات السوق الثانوية والعامة هي صناعة 
بمليارات الدولارات (انظر الفصل 7). 


البيانات التأشيرية (1262 [2ع120»:1). البيانات الخاصية (1262 عغاناط1اغة)ء 
والبيانات الوصفية (751»]20262): 

مفنليف البناننات أيشا في النوع. فالبيانات التأشيرية هي تلك البيانات التي تتيح 
التعريف بالبيانات وربطها بغيرها من البيانات الأخرى. وتشمل معرّفات فريدة من نوعهاء 
مثل أرقام جوازات السفر وبطاقات الضمان الاجتماعيء وأرقام بطاقات الائتمانء والأرقام 
التسلسلية اللمصنعة» ومعرفات الكائن الرقميء وعناوين الربط الشبي (3/]40 لصه 15): 
وأرقام الشحن وطلبات الشراءء إضافة إلى الأسماء. والعناوين والرموز البريدية. إن البيانات 
التأشيرية مهمة لأنها تساعد في حصر كميات كبيرة من البيانات غير ا مفهرسة بعضها مع 
بعض وتتبعها من خلال معرفات مشتركة. والمساعدة على التمييز بينها. وضمهاء وتقسيمها 
وإعادة تجميعهاء والبحث فيها وغيرها من أشكال المعالجة والتحليل. وكما هو مبين في 
الفصل الرابعء فقد أضحت البيانات التأشيرية شائعة على نحو متزايد وبصورة متخصصة, 
مما يزيد من درجة الارتباط والعلائقية بين مجموعات البيانات. أما البيانات الخاصية 
فهي بيانات تمثل جوانب من الظاهرة: ولكنها ليست تأشيرية بطبيعتهاء وعلى سبيل المثال» 
بالنسبة إلى شخص ماء قد تكون البيانات التأشيرية هي بصمات الأصابع أو تسلسل الحمض 
النووي (4ل10(8). وقد تكون بيانات الخاصية له مثل العمرء الجنسء الطولء الوزنء لون 
العينينء فصيلة الدم: وغيرها. مع ملاحظة أن الغالبية العظمى من البيانات التي يتم 
إنشاؤها وتخزينها في الأنظمة هي بيانات الخاصية. 

البيانات الوصفية هي بيانات عن البيانات» ويمكن أن تشير البيانات الوصفية إلى 
محتوى البيانات أو مجموعة البيانات كاملة. وقد تشمل البيانات الوصفية عن المحتوى 
أسماء ووصف حقول بيانات محددة على سبيل المثال» رؤوس الأعمدة في جدول البيانات 
وتعريفات البيانات. وتساعد هذه البيانات الوصفية مستخدم مجموعة البيانات على 
فهم مكونات البيانات وتركيبتها وكيف ينبغي استخدامها وتفسيرهاء وتساعد في الدمج بين 
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مجموعات البيانات» وقابلية التشغيل البيني وتبادل البيانات بينهاء والاكتشاف. والقدرة 
على الحكم على مصدر البيانات وسندها. أما البيانات الوصفية التي تشير إلى مجموعة 
البيانات كلها فلها ثلاثة أشكال (2004 21150). فالش كل الأول يتعلق بالبيانات الوصفية 
التوضيحية والتي تشير إلى بيانات التحديد/التعريف والاكتشاف المتعلقة بمجموعة 
البيانات» وتشمل عناصر مثل الاسم. والمؤلفء والناشر, والموضوع., والوصف. ويتضمن 
الشكل الثاني البيانات الوصفية الهيكلية والتي تشير إلى بيانات التنظيم والتغطية لمجموعة 
البيانات. ويحتوي الشكل الثالث البيانات الوصفية الإدارية التي تعكس متى وكيف تم 
إنشاء مجموعة البيانات. وتفاصيل الجوانب الفنية للبيانات. مثل صيغة تنسيق الملف»ء 
ومن الذي يملك وله صلاحية استخدام البيانات. ومن المعايير الشائعة للبيانات الوصفية 
والذي يجمع الأنواع الثلاثة للبيانات الوصفية معيار دبلن كور (//:مغط) (001 صناطنا<1 
111601685). ويشترط هذ المعيار تمتع مجموعة البيانات بخمسة عشر عقلا 
للبيانات الوصفية هي : العنوانء المنشىء», الموضوع: الوصفء الناشر, المساهم. التاريخ 
النوع: الصيغة. المعرّف. المصدرء واللغة. العلاقة, التغطية / النطاق, والحقوق / الصلاحيات. 
وبرغم أن البيانات الوصفية تعد أحد المكونات الأساسية لكافة مجموعات البياناتء إلى 
أنه يجري إهمالها في ممارسات دعم الإتاحة وإعادة الاستخدام والمشاركة للبيانات (1268 
ده نان ).: وخصوصا من الباحثين الذين يجمعون البيانات الأساسية لاستخدامهم الخاص 
دون مشاركة الآخرين بها. 


البيانات (10262): والمعلومات (22102:اهم؟)م1)ء والمعرفة (ع2)1220171»05 
والحكمة (18715002): 

ما يوحد الأنواع المختلفة من البيانات التي تم التطرق إليها في الأجزاء السابقة هو 
أنها تشكل القاعدة أو الأساس الذي يقوم عليه هرم المعرفة: فالبيانات تسبق المعلومات, 
والمعلومات تسبق المعرفة: والمعرفة تسبق الفهم والحكمة (2ءعة1ءطصء/11 :1986 4016 
1. وتتميز كل طبقة من الهرم من خلال عملية التقطير (التقليل» التلخيص والتجريد. 
المعالجة والتجهيزء التنظيم: التحليلء التفسيرء والتطبيق) التي تضيف التنظيم, المعنى» 
والقيمة من خلال الكشف عن العلاقات والحقائق حول العام (انظر الشكل .)١١١‏ 
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وفي حين أن ترتيب المفاهيم داخل الهرم هو لا جدال فيه على العموم: إلا أن طبيعة 
المفاهيم والاختلافات بينها كثيراً ما تختلف بين المدارس الفكرية. فا معلومات. على سبيل 
المثال» هي المفهوم الذي يفهم على نحو مختلف بين العلماء. فبالنسبة للبعضء المعلومات 
هي تراكم البيانات المرتبطة بهاء وبالنسبة للآخرين هي البيانات إضافة للمعنىء أو الإشارة 
ذات المعنى في ضوضاء البيانات» أو البناء متعدد الأوجه. أو البيانات العامة حيث تم 
إعادة صياغة البيانات الأساسية من خلال نموذج تحليلي. فبالنسبة لعا الفيزياء» البيانات 
هي مجرد سلسلة من الأصفار والآحاد, أي (8165) خام؛ وتعد ضوضاء (©71015). ولذلك 
فإن ال معلومات بالنسبة لعام الفيزياء تتكون عندما يتم تنظيم هذه الأعداد من الصفر 
والواحد في أنماط متميزة؛ فهذه هي الإشارة المفيدة (2003 ع(82 702). فموجات 
الأثبر وكابلات الاتصالات هي ممتلئة بالمعلومات المتدفقة - كإشارات الراديو والتلفاز 
والمحادثات الهاتفية وحزم بيانات شبكة الانترنت - التي تعني أنماطا ذات مغزى من 
البيانات ضمن حزمة أوسع من الضوضاء. وبالنسبة لآخرين. فالمعلومات ذات مفهوم 
أوسع. فقد حدّد (74 :2010 1510101): على سبيل المثالء ثلاثة أنواع من المعلومات : 
« الواقعية (136]02[1): معلومات تعكس الحقيقة (على سبيل المثالء الأنماطء بصمات 

الأصابع. وحلقات جذوع الأشجار). 


٠‏ التعليمية (1256:00281): معلومات لأجل الحقيقة (على سبيل المثالء الأوامر, 
الخوارؤميات» والوضفات). 

٠‏ الدلالية (22261م»5): معلومات عن الحقيقة (على سبيل المثالء الجداول الزمنية 
للقطاراتء الخرائطء والسير الذاتية). 


ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة, والبنى التحتية للبيانات, والنتائج المترتبة عنها م 


الفصل الأول 


)١-١( شكل‎ 


هرم المعرفة (منقول من 2010 ووء1لصدن»ء21 كسد 1986 161ل4) 





فالنوع الأول هو أساساً بيانات ذات معنىء وهو ما يطلق عليه عادة الحقائق. وهي 
البياضات التي يتم تنظيمها وتركيبها ضمن نظام قياس أو مرجع غارجي يوكر بيع 
أساسا لإنشاء المعنى الأولي الذي يحمل بعض الحقيقة. وتمتد ال معلومات أيضا إلى ما 
بعد البيانات والحقائق من خلال إضافة قيمة تساعد على التفسير. وعليه. أوضح 
(2 :2011 ععءططنء؟18) أن : "ال معلومات بالنسبة للبياناتء كالنبيذ بالنسبة لحقل 
العنب: استخراج نواتج التقطير اللذيذة! ". ولذا يممكن الحصول على هذه القيمة من 
خلال فرز وتصنيف. وربطء وإضافة المحتوى الدلالي من خلال بعض الشكل النصي أو 
الصوري والذي يشير إلى شيء ما و/ أو يرشد إلى ما ينبغي القيام به (على سبيل المثالء 
الإشارة الضوئية التحذيرية على لوحة معلومات مؤشرات عمل السيارة التي تشير إلى 
فراغ البطارية وحاجتها لإعادة الشحنء 2010 ,810:141). وقد بيّن (2002: ملخصاً في 
025 (40 :2007 ةدمع80 أن الاختلافات في تعريف المعلومات تتوقف على خمس 
مسائل: 
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عدم اليقين (7اصطتهاععمنا). أو ما إذا كان شيء ما قد يحد من عدم اليقين 
في تأهيل البيانات لتكون معلومات؛ المادية (تزذلءزهجط2). أو ما إذا كان 
شيء ينبغي أن يؤخذ على شكل مادي مثل كتابه أو كائن» أو موجات صوتية 
لكلمة خطيب تتأهل البيانات لتكون معلومات؛ البنية / العملية (/ع1نهاءنا5 
55 أو ما إذا كان يلزم مجموعة من الترتيبات أو العلاقات؛ القصد والعزيمة 
(#انلههه8مء:م1) أو ما إذا كان شخص ما قد أوعز بأن شيئا ما تم التواصل معه 
ليتأهل ليكون معلومات؛ والحقيقة (10ن:1). أو ما إذا كان ينبغي أن يكون 
الشيء صحيحاً للتأهل ليكون معلومات. 
وبغض النظر عن كيفية تصور ذلك. فقد لاحظ (581051012010) أنه بالنظر إلى إضافة 
المعلومات المعنى إلى البيانات» فهي تكتسب القيمة الربحية كسلعة. غير أنهاء كنوع متميز 
من السلع: تمتلك ثلاثة خصائص رئيسية مميزة (والتي تتميز بها البيانات أيضا): 
غير تنافسية ( 7102-11578110115): حيث من الممكن لأكثر من مستخدم أن يمتلك نفس 
المعلومات دون التأثير على مدى استفادة اللمستخدمين الآخرين منها (على عكس السلع 
المادية المستهلكة). 
غير قابلة للاستثناء أو الإقصاء (©101861ء<»-2102): حيث يتم تقاسمها ومشاركتها 
بسهولة ويلزم بذل جهد كبير في السعي للحدذ من مثل هذه المشاركة (مثل فرض اتفاقيات 
حقوق الملكية الفكرية أو إضافة حواجز الدفع (578115ز52) قبل الاستخدام). 
التكلفة الهامشية 00560 15231ع:21 2»10): بمجرد إتاحة المعلومات من المرة الأولى,» 
فإن تكلفة الاستنساخ أو إعادة الإنتاج في كثير من الأحيان لا تكاد تذكر. 
ومع التشديد على خصائص كون المعلومات مورد يتميز بعدم المنازعة وعدم الاستثناء 
ولأن المعلومات تعد سلعا قيمة. تسعى العديد من الكيانات لضبطها والحد من تداولها 
والسيطرة عليها ومن ثم زيادة قيمتها. ومعظم هذه القيمة تضاف من خلال العمليات 
التي تفرض خلال دورة حياة المعلومات (2010 710101) والمشتملة على المراحل التالية: 
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الوجود (ع©2862تاء06): الاكتشافء التصميم, التأليف. 
الإرسال (152512155102): التشبيك. التوزيع:ء النفاذ. الاسترجاعء النقل. 


امعالجة والإدارة (غ2ع<اعع 81222 220 عتنزووءء2*0): الجمع. التحقق. التعديل» 

الاستخدام (115386): الرصد وامراقبة, النمذجة. التحليل: الشرح. التخطيطء التنبق 
اتخاذ القرارات» التوجيه. التعليم» التعلم. 

ومن خلال المعالجة والإدارة والاستخدام يتم تحويل المعلومات إلى معرفة أكثر قيمة. 


وكما هو الحال مع جميع المفاهيم في هرم ال معرفة. وبا لمثلء يختلف فهم مفهوم 
المعرفة. فبالنسبة للبعضء المعرفة هي الدراية التي تحول المعلومات إلى تعليمات 
(2011:3 تتعونةء طضذء117). فعلى سبيل المثال. يممكن ربط ال معلومات الدلالية إلى وصفات 
وتعليمات (أولاً قم بهذاء ثم افعل ذلك..) أو نموذج شرطي لإجراءات استنتاجية (إذا 
كان الحال هو كذا وكذا فافعل ذاكء وإلا افعل هذا) (2010 510141). في هذا التأطير, 
تكون المعلومات هي البيانات الهيكلية, والمعرفة هي معلومات إجرائية قابلة للتنفيذ 
(2011 عع طصنء؟؟1؟). وبعبارة أخرى. "المعرفة هي الوصفة التي تحول ال معلومات 
إلى الخبز القابل للأكلء بينما البيانات هي العناصر المكونة للدقيق والخميرة" (تإصهاء2 
7:؛ منقول عن 2011 2518615 1876). وبالنسبة للآخرينء فإن المعرفة هي أكثر من 
مجرد مجموعة من التعليمات ؛ ويمكن أن تكون امهارات العملية: وأبعد بكثير عن مجرد 
وسيلة لمعرفة كيفية إجراء أو تحقيق المهمة. أو النظام الفكري الذي يربط بشكل متسق 
ا معلومات مع بعضها البعض للكشف عن صورة أوسع لظاهرة ما. وينطوي إيجاد 
المعرفة على تطبيق العمليات ال معرفية المعقدة على ا معلومات مثل الإدراك. والجمع 
والتركيبء والاستخلاص, والدمج والتكوينء والاستنتاج والربط. وللمعرفة قيمة أكبر من 
قيمة المعلومات لأنها توفر أساسا لفهم, وتوضيح» ورسم رؤى حول العالم, والتي من 
الممكن استخدامها في صياغة السياسات والإجراءات. أما الحكمة. التي تحتل قمة هرم 
ا معرفة. فهي القدرة على تطبيق ا معرفة برجاحة وروية. 
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وبرغم أنه م تتأصّل بثبات علاقة كل أشكال المعرفة بالبيانات» على سبيل المثال» التخمين 
والآراء والمعتقدات. إلا أن البيانات تشكل بوضوح مادة القاعدة الرئيسية لكيفية استشعار 
الواقع والعامم من حولنا. حيث تشكل البيانات المدخلات الأماسية في العمليات مثل 
الجمع, الفرزء التصنيفء المطابقة» التشخيص / التنميطء والنمذجة التي تسعى إلى إنشاء 
المعلومات والمعرفة من أجل فهم الظواهر. والتنبؤ بهاه وضبطها والسيطرة عليها. كما 
يمكننا إنتاج البيانات بمرور الوقت وفي أماكن مختلفة من تتبع: وتقييم» ومقارنة الظواهر 
عبر الأزمنة والأماكن والنطاقات. وهكذاء وعلى الرغم من أنه يفاد إلى المعلومات والمعرفة 
إلى كونها مفاهيم ذات درجة أعلى وقيمة أكبرء تبقى البيانات. مع ذلك عتضرا أسانسيا با مع 
قيمة كامنة كبيرة يجرى إدراكها وتحصيلها عند تحويلها إلى معلومات ومعارف. فالدافع 
المنطقي الرئيسي لحركة البيانات المفتوحة:» والتي بحثت في الفصل الثالث» هو القدرة على 
الوصول إلى القيمة الكامنة في مجموعات بيانات القطاعات الإدارية والعامة. 


تأطير البيانات (12262 عومنصسة1): 
حتى الآن في هذا الفصلء فقد بدأت بالفعل صياغة البيانات من الناحية النظرية من حيث 
مناقشة أنطولوجيا البيانات (ماهية وجودها). وأشكالها المختلفة, وأين تتموضع داخل هرم 
المعرفة. كما أن هناك عدداً لا يحصى من الطرق الأخرى التي يمكن بها فهم البيانات والتفكير 
بها. على سبيل امثالء من ال منظور التقني الخاص بجودة البيانات» وصحتهاء وموثوقيتهاء 
ونسبتهاء وقابليتها للاامتخدام: وكيف يمكن معالجتها وتنظيمهاء وتقاسمهاء وتحليلها؛ أو 
من المنظور الأخلاقي المتعلق بالأسباب التي دفعت إلى إنتاج البيانات والاستخدامات التي 
يتم توظيفها بها؛ أو من المنظور السياسي أو الاقتصادي والذي يأخذ بعين الاعتبار التصور 
المعياري للبيانات ومواضع الطعن والتنازع والتنافس فيها كمنفعة عامة, ورأس مال سياسيء 
وملكية فكرية. أو سالعة تجارية. وكيف يتم تنظيمها وتداولها؛ أو من المنظور المكاني و/ أو 
الزماني المتعلق بكيفية إنتاج البيانات وتطوير استخداماتها ومحاور تركيزها من قبل الأنظمة 
وال مجموعات التقنية, والأخلاقية. والسياسية, والاقتصادية عبر المكان والزمان؛ أو من المنظور 
الفلسفي الذي يأخذ بعين الاعتبار المفاهيم المبدئية والمعرفية للبيانات. وسترجع لاستذكار 
العديد من القضاياء التي تم بحثها في هذا القسم, لاحقاً في جميع أجزاء الكتاب ال مقبلة. 
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المنظور ١‏ لفني (وللهعتسطع 1 ): 

في جميع التخصصات. يتم أخذ البيانات بعين الاعتبار من وجهة النظر التقنية المعيارية. 
والسؤال المطروح على المحك هو إلى أي مدى تنتج طرق التقاط البيانات وقياسها بيانات 
محددة. ونظيفة» ودفيقة, وكيف يكن وينبغي معالجة. وتنظيم. ومشاركة. وتحليل هذه 
البيانات بطرق تحافظ على سلامتها. من أجل ضمان موثوقيتها وصلاحية الاستنتاجات 
اللسشفلضة منهاء :ولذا كان هثالك دافا شكوك كيم يتدلق 'بصطة البيانات لأنيا تظريعنيا 
مجردة. وعمومية, وتقريبية عند إنتاحها (2009 114طء6000). وحيث ذلكء فقد توجه 
الكثير من الاهتمام إلى قضايا تتعلق ممفاهيم تمثيل البيانات (55ع05765)ة]ءوع1مع1 10268)» 
وعدم اليقين بصحتها (إ56خ1ه:1ءءم17), ودرجة الموثوقية بها (6ذ1ذطهذاء2).: والأخطاء 
ا ممكنة المصاحبة لها (181501): والتحيز ال منتقص لمصداقية دلالاتها (8125): وامعايرة 
(11210هن) في تصميم البحوث وتطبيقاتها. وتسجيل هذه ال معلومات كبيانات وصفية. 

وبالنظر للبيانات على أنها علامة بديلة عن بعض جوانب ظاهرة ما - كالضوء يمثل نجماً 
والخصائص الفيزيائية التي تمثل مبنىء والكلمات التي تمثل أفكار شخص - يتعلق التمثيل 
(165626361576255م112) بمدى التقاط البيانات لهذه الظاهرة التي تسعى إلى تمثيلهاء وإلى 
أي مدى تمثل عينة البيانات التي تم إنشاؤها المجتمع الكامل للظاهرة. وفيما يتعلق 
بالسؤال السابقء فإن السؤال الرئيسي هو إلى أي مدى يمكن أن نكون على ثقة من أن 
التقنيات العلمية قد التقطت بدقة الظاهرة قيد الدراسة. لقد مثل هذا التساؤل مشكلة 
خاصة في مجال العلوم الاجتماعية والإنسانية وأثبت أنه كان من الصعب حلها. فعلى 
سبيل المثال» لوحظ بشكل كبير أن ما يقول الناس أنهم سيفعلون وما يفعلونه في الغالب 
ما يكون مختلفا تماما عن الواقعء وما يفعله الناس في كثير من الأحيان قد لا يقصدونه. 
ولذلك برز سؤال حول المدى الذي تمثله بيانات المقابلة الشخصية للسلوك البشريء أو 
مدى تمثيل الفكر الواعي لهم. وبالمثلء هناك مخاوف بشأن مدى التقاط وتمثيل المؤشرات 
الرئيسية للتعبير بدرجة كافية عن كيفية أداء مجال ما. على سبيل المثالء إلى أي مدى 
تعطي اللؤشرات المتعلقة بعدد مرات الاقتباس» ومؤشر إتش (11-1206)» وبراءات الاختراع 
المسجلة دلالة على أداء عالي الجودة من قبل موظفي الجامعة (مع الاحترام لأعضاء هيئة 
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التدريس في مجال العلوم الإنسانية فإن هذه اللمؤشرات تعد سيئة للغاية)؟ ولذا كان الحل في 
محاولة تطوير تصاميم بحثية أكثر تعقيدا لمواجهة أوجه القصور في هذه الأساليب المختلفة, 
أو تجاهل أوجه القصور المتعلقة بها إلى حد كبير. 

وبالنسبة للا يتعلق بمدى تمثيل عينة المجتمع دراسة ماء فقد نقرر, اعتماداً على خمسين 
نجمة: إنتاج بيانات فلكية هائلة:» ومفصّلة» وعلى مدى طويل من أجل فهم أفضل 
لطبيعتها. ولكن إلى أي مدى يمكن أن نكون على ثقة بأن هذه الخمسين نجمة تمثل مجمل 
خصائص المليارات الأخرى من النجوم الموجودة؟ وحتى في عصر البيانات الكبيرة» التي 
تسعى إلى أن تكون شاملة وليست انتقائية في إنتاج البيانات (انظر الفصل الرابع)» فإن 
البيانات هي بطبيعتها عينة (فليس كل الناس يستخدمون وسائل التواصل الاجتماعي» أو 
يتسوقون باستخدام البطاقات الائتمانية» وبالتأكيد لا يمتلك كثير من الناس في جميع أنحاء 
العام حق الوصول إلى الهواتف وأجهزة الحاسب). وهذا يعني أن البيانات هي ممثلة 
لجموعة من القاس حصي لو كافة هذه اللجموعة كبيرة حداء :ومرة أخرئ: كان الحل هو 
ابتكار مجموعة من تقنيات أخذ العينات التي تسعى إلى ضمان التمثيل الدقيق في ظل 
مختلف الظروف (والتي تعتمد غالباً على عينة عشوائية). واستحداث أساليب إحصائية 
تقوم بحساب مدى الثقة التي يمكننا أن نكون عليها حيال تمثيل عينة ما لمجتمع الدراسة 
(1999 م12" همه صستط ك1 ). 

وتتعلق الموثوقية بالتكرارية أو الاتساق في الحصول على النتيجة نفسها من توظيف 
آلية البحث. وقد وصف (1997 <هندص)5 سه ء6011608) ثلاثة أنواع من المموثوقية: 
)١(‏ الموثوقية التصوريّة (167لأطهناء عتامعنناو)ء حيث تؤدي طريقة واحدة للملاحظة 
والاستكشاف إلى قياس غير متشير باستمرار. (0) الموثوقية الزمنية المتعاقبة (عتممعطعوذط 
111177 2) وفيها يكون استقرار ال ملاحظات عبر الزمن. (") الموثوقية التزامنية 
(1[167طهناءخ1 عندمخغطعءعهر5): وفيها يكون التشابه في الملاحظات خلال الفترة الزمنية نفسها. 
وتّعد الموثوقية مهمة لأنه من المسلّم به أنه كلما كان القياس أكثر اتساقاً في إنتاج البيانات, 
أمكن بشكل أكبر وصف هذه البيانات بأنها بيانات موثوقة. 
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والخطاً هو الفرق بين القيمة المقاسة والقيمة الحقيقية» ويمكن أن يشمل الغيابات 
البيانات المفقودة. والأخطاء مثل الخطأ في الإدخال / الترميز أو الخطأ في التصنيف أو سوء 
تطبيق الأملوب التقني» وسوء الفهم. أما التحيز فهو نوع معين من الخطأء حيث تنحرف 
البيانات بسبب نمط ثابت من الخطأ. وعادة ما يحدث التحيز بسبب الطريقة: أو الأداة, 
أو أسلوب أخذ العينات المستخدم لإنشاء البيانات والتي لها تأثير مفرط على البيانات التي 
يتم إنتاجهاء أو يمكن تقديمها بسبب موقف إيديولوجي أو تطلعات الباحث في كثير من 
الأحيان بطريقة غير متعمدة (1996 صنطء14؟1). ومن الممكن أن تتسبب آليات المعالجة 
مثل التجميع أو الإجمال في إحداث تحيز من خلال الحدٌ من التباين في مجموعة البيانات 
مما يؤدي إلى أخطاء امغالطة المنطقية للاستدلال البيئي (2015ظ 182112 لدعذعه1مء8)» 
بمعنى أنه على افتراض تمثيل القيمة الإجمالية مجموع الأفراد بدقة على سبيل المثال إذا 
كان لدينا شفخصين وزنهما 0٠‏ كيلوجراماً وآخرين وزنهما 16١‏ كيلوجراماً فسيكون متوسط 
الوزن الإجمالي هو ٠٠١‏ كيلوجرام: ولكن لا أحد في المجموعة يزن هذا الوزن في الواقع 
(1997 تاقد تعط)80 لصه صنحكءغ1). ويتعلق مفهوم عدم اليقين بمدى ثقة الباحث 
بخصوص دقة البيانات وأي تحليل قائم على أساسها. أما فيما يتعلق بالبيانات الكمية, 
فيتصل بدرجة اليقين بالاختبار الإحصائي وذلك بالنظر إلى البيانات المدخلة» وعادة تحتسب 
على أساس الاحتمالات ويُعبّر عنها بمستويات الثقة (2009 14نداء6004). أما مفهوم عدم 
اليقين بالنسبة للبيانات النوعية. فيجري في الغالب تقييمه والحكم عليه من قبل خبير بناء 
على الخبرة السابقة. 

وتتمثل دعائم معالجة هذه المخاوف بالإيمان بأن مثل هذه القضايا تنشأ بسبب الضعف 
البشري في تصميم البحث أو أوجه القصور وعدم كفاءة الأدوات والمعدات أو الطرق 
المستخدمة والتي من الممكن التغلب عليها من خلال الحلول التقنية. وهذا يعني أنه من 
الممكن معالجتها عن طريق تحسين نوعية الإجراءات والمعدات المستخدمة:. وتطبيق أنظمة 
التوحيد القياسي (التقييس- 5]202101236102) والتي توفر معاي 
مثل تلك التي أقرتها المنظمة الدولية للمعايير آيزو (150)» والتي تعمل على إيجاد سبل 
للتعويض عن عدم اليقين والخطأ والتحيز في وسائل التحليل ا مستخدمة. 
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المنظور الأخلاقي (17[دعنط)8): 

الأخلاق معنيّة بالفكر والممارسة المتعلقة بمفاهيم القيم مثل العدالة: والممساواة, 
والنزاهة. والصدقء والاحترام, والحقوقء والواجبات. والرعاية. ويعمل كل مجتمع وفق 
مزيج من القيم الأخلاقية الفطرية البديهية والعامية غير الرسمية: المسلم بهاء والمواقف 
الأخلاقية المقننّة جيداً وا منصوص عليها في قواعد. ومبادئ. وسياسات, وتراخيص, وقوانين 
تخضع للإنفاذ من قبل أجهزة الدولة والوكالات الأخرى. وكثيراً ما تكون هذه المواقف 
الأخلاقية محل نزاع بين مجموعات مختلفة تأخذ وجهات نظر متناقضة عن القيم نفسها 
وإلى أي مدى ينبغي إخضاع المواقف الأخلاقية للتشريع القانوني» ومناقشتها كممارسة في 
الفلسفة الأخلاقية. كما يوجد مثل هذا الطعن فيما يتعلق بالبيانات. وخاصة ما يتعلق مما 
يتم إنشاؤه من بيانات ووسائل الإنتاج لهاء وكيفية مشاركة البيانات وتقاسمهاء وتداولهاء 
وحمايتهاء وإلى الحدود التي ينتهي عندها العمل بها. 

ففي حين: تعد بعض البيانات معتدلة نسبيا على سبيل المثال القياسات المتعلقة 
بالطقسء فإن بعض البيانات الأخرى تعد حساسة للغاية» كالبيانات المتعلقة بالأفراد والتي 
يممكن استخدامها لإنتاج صورة مفصّلة عن الحياة المعيشية لهم وضبط وتنظيم تلك الحياة 
على إيقاع معين. وقد يلحق إنتاج البيانات ضرراً في بعض الحالات: على سبيل المثال 
الأضرار التي قد تنتج عن إجراء مقابلات مع ناجين من جرائم الحرب وما قد تتسبب 
فيه تلك المقابلات من ضغوطات نفسية وضيق. وفي هذا المقام. هناك تساؤلات حول 
المدى الذي من الممكن أن يشكل فيه إنتاج البيانات. ومختلف أشكل اراقبة والترصد 
للبيانات (عع2ه11اء:5ة106) أي امراقبة والرصد من خلال معالجة وتحليل سجلات البيانات» 
وتحليل البيانات تعديًا على الخصوصية وحقوق الإنسان الأخرىء وتساؤلات أيضاً حول 
المدى الذي يمكن أن تستخدم فيه هذه البيانات بفعالية لفرز الأفراد اجتماعياً معنى تقديم 
خدمات تفضيلية على أساس خصائص الأفراد ا مميزة لهم (2005 مصهطه6). وتتعاظم 
هذه ال مخاوف بالنظر إلى سهولة جمع ومشاركة وتداول البيانات الرقمية. ونحن نعيش في 
عصر توليد البيانات ومراقبتها بصورة طاغية وعلى نطاق واسع. ولعله ليس من المستغرب 
بعد ذلك أن وكالات تمويل البحث العلمي ومؤسسات التعليم العالي الآن تقيّم بشكل دوري 
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الأبعاد الأخلاقية للمشاريع البحثية نظراً لآثارها المحتملة على نطاق أوسع؛ وإضافة لذلك 
فقد سنت الدول تشريعاتء مثل قوانين حماية البيانات وقوانين الخصوصية. في محاولة لمنع 
سوء الاستخدام والتجاوزات المسيئة للبيانات. ولقد تم مناقشة هذه ال مسائل وما يتصل بها 
بشكل مفصل في الفصل العاشر. 


المنظور السياسي والاقتصادي (إالهءتتصمصمءظ8 لصه جللدعنغناهط): 

مثل الاهتمام بال منظور الأخلاقي للبيانات البداية للكشف عن الطرق التي تعمل على 
تأطير البيانات من خلال الاهتمامات السياسية والاقتصادية على نطاق أوسع. وتتعلق 
هذه الاهتمامات بماهية البيانات التي يتم إنشاؤهاه وكيفية معالجتهاء وتحليلهاء وتوظيفها 
بالسية ال كفية تضفر اليانات وتوضيقها معيادا ضمق الحميفاث اليكانية وتوظيقيا 
من قبل الدولء ومفاهيم الكيفية التي ينبغي بها تنظيم البيانات وتقنينها؛ والمناقشات التي 
تطرح ضمن مجموعات الاختصاص التي تؤيد أو تعارض إنتاج البيانات وتطبيقاتها؛ واتخاذ 
القرار حول التمويل والاستثمار في البيانات؛ وانتشار الرأسمالية والطرق التي تستخدم 
البيانات لإدارة المساعي وزيادة القيمة والأرباح؛ والتداول للبيانات كسلعة مع ظهور سوق 
للبيانات تقدر قيمته بمليارات الدولارات والتي يشارك فيها مجموعة متنوعة من اللاعبين 
كالمنتجينء المجمّعينء البائعين ا لمحللين» والمستهلكين, انظر الفصل الثاني. فمنتجو البيانات 
ينبغي عليهم الأخذ بعين الاعتبار الرأي العام والسياسيء والاعتبارات الأخلاقية والبيئة 
التنظيمية والتمويل ا متاح وسلامة استثماراتهم إزاء الموارد. كما ينبغي على أولئك القائمين 
على الساحتين التشريعية والتمويل المالي أن يكون لديهم سعة الأفق واتخاذ القرارات حول 
كيفية تشكيل المشهد الذي يعمل به منتجو ومستخدمو البيانات. وكذلك النظر في أنظمة 
العمل المتعلقة بالبيانات الخاصة بهم وما يكشفونه عن جداول أعمالهم وأولوياتهم 
وأساليب الإدارة والحوكمة الخاصة بهم (2012 16نهتدده]). 

وفي كلتا الحالتين» هناك مجموعة متنوعة من العلاقات السياسية والاقتصادية العقلانية 
في المشهد. مع أصوات متنافسة تسعى للتأثير على الرأي ومشهد البيانات على النطاق 
الأوسع. فعلى سبيل المثالء فإن حركة البيانات المفتوحة تمثل البيانات كسلعة عامة تتشكل 
من العموم وتكون في متناول الجميع بعرية مظالقة باس نام النانات العناسة أمنياء 
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والشخصية الخاصة أو يمكن الوصول إليها من خلال اتفاقيات الاستخدام العادل. وفي 
المقابلء يعرض قطاع الأعمال البيانات كسلعة تجارية قيّمة تحتاج من جهة إلى الحماية 
من خلال أنظمة الملكية الفكرية (حقوق الطبع والنشرء براءات الاختراع» وحقوق الملكية) 
ولكنء من جهة أخرى لا ينبغي ربطها بشدة بالمحاذير الأخلاقية التي تمنع من استغلالها 
لتحقيق المكاسب الالية. أما بالنسبة للمجتمعات والدولء فالبيانات هي الوسائل التي 
يمكن من خلالها تقنينء وممارسة. ومنازعة الأجندات السياسية والأعمال عبر تمكين بناء 
الإثباتات - أي الروايات المسندة والدعوات المضادة التي لها قيمة بلاغية أكبر من مجرد 
التندر أو دغدغة المشاعر (2013 تإ»681 :2011 1871502). وبعبارة أخرىء تعد البيانات 
بالنسبة لعالم الفلسفة الفرنسي 1981) 15نتوعتده8) شكلاً من أشكال السلطة / ال معرفة؛ أي 
وسيلة يمكن من خلالها ضبط وتنظيم الشعوب. والظواهر والأقاليم (2012 نه تهتته.آ). 
وتتقاطع هذه الاهتمامات والمصالح البديلة في كثير من الأحيان بطرق متناقضة. من حيث 
أنه قد يكون لها أجندات مختلفة تماماء على سبيل المثال دعم الأعمال التجارية الكبيرة 
لحركة البيانات المفتوحة فيما يتعلق بالبيانات العامة (انظر الفصل الثالث). وبعبارة 
أخرىء تظهر البيانات جلياً وتتموضع ضمن الاقتصادات السياسية المعقدة. وفي الوقت 
نفسه فهي تستخدم لتشكيل مثل هذه القضايا والنظم وا مجموعات. 


معلاوة عن قللقه فشكل البانات موزذا اقتصاذيا. وهي عنصر أساسي في المرحلة المقبلة 
من الاقتصاد القائم على المعرفة,ء وتعمل على إعادة تشكيل نمط الإنتاج القائم على البيانات 
(انظر الفصل السابع). ومنذ أواخر الثمانينيات (11805). يرى بعض العلماء مثل 115ع]026© 
(1996 ,1988) أن آخر دورة للرأسمالية يدعمها إنتاج المعرفة التي تنشئ منتجات وأشكال 
عمالة جديدة: وتسهّل إعادة الهيكلة الاقتصادية, وتعزز الإنتاجية والقدرة التنافسية: والكفاءة, 
والاستدامة» وتراكم رأس المال. وتعد البيانات الكبيرة, على وجه الخصوصء هي أحدث 
التطورات المتعلقة بتعميق وتعزيز هذه الدورة» وتوفير ثورة من الأدلة التي يتم استخدامها 
من قبل الشركات من جهة: لرصد وتقييم أداء الشركة اللحظيء والحدٌ من الهدر والاحتيالء 
وتحسين إستراتيجية الشركات, والتخطيط وصنع القرارء ومن جهة أخرىء لتصميم سلع جديدة, 
وتحديد واستهداف أسواق حديدة. وتطبيق التسعير المتغيرء وإدراك الإمكانات غير المستغلة, 
واكتساب ميزة تنافسية (2012 .21 © 211056011105 :2011 .21 اه وعااتصه3/1). وفي سبيل 
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القيام بذلك» يمكن إنتاج وتحليل البيانات من تشغيل الشركات بشكل أكثر ذكاء فيما يتعلق 
بكيفية تنظيمها وتشغيلهاء وتعزيز المرونة والابتكار. والحد من المخاطر والتكاليف والخسائر 
التشغيلية» وتحسين تجربة العملاءء وتعظيم العائد من الاستثمار والأرباح. وكقائد لعملية 
تراكم رأس المالء ستسهم البيانات الكبيرة في إيجاد أعمال (وظائف) جديدة وفي الجولة المقبلة 
من التنمية غير المتوازنة ومن هذا المنظور يمكن فهم البيانات على أنها وكيل لمصالح رأس امال 
واهتماماته. 


المنظور الزماني والمكاني (2612117م5 لصة توللدءتهصصء1): 

تمتلك البيانات أبعادا زمانية ومكانية على حدّ سواء. حيث تختلف ماهية البيانات التي 
يتم إنتاجها والطرق التي يتم بها معالجتهاء وتحليلهاء وتخزينهاء أو التخلص منها باختلاف 
الزمان وال ممكان؛ أي أن للبيانات ومجاميعها المحيطة بها دلالات تاريخية وجغرافية. كما 
تتغير كيفية معالجة البيانات وتحليلها مع مرور الوقتء متآثرة بالتغيرات والتحسينات 
التنظيمية في التعداد والإدارة والقوانين الجديدة المتعلقة بتداول البيانات وحمايتهاء 
والتقنيات الجديدة. والطرق الجديدة في فرز البيانات وتحليلهاء والاختلافات الإحصائية 
الجغرافية مثل حدود المقاطعة المحلية أو الوطنية الجديدة: والأساليب الإحصائية الجديدة. 
وعلاوة على ذلكء يمكن لمجاميع البيانات التي تستخدم في ولاية معينة أن تكون مختلفة 
تماما عن تلك التي تستخدم في أخرى. وحتى داخل حدود الولاية الواحدة, فقد تختلف 
الطريقة التي يقوم فيها كيان ما بإنتاج البيانات وإدارتها بسبب التقلبات المؤسسية أو 

وبالنظر في التعدادات السكانية: يتكون التعداد من مسح شامل لنطقة وساكنيهاء 
ويتم إجراء المسح في العادة كل عشر سنوات. والهدف من ذلك هو جمع معلومات 
أساسية حول المقيمين في منطقة ما وخصائصهم على سبيل المثال» العمرء الجنسء الحالة 
الاجتماعية: التركيبة الأسرية. الدينء العرقء الطبقة الاجتماعية. وما إلى ذلك وجوانب 
عيشهم فيها (عملهم.ء ومكان الإقامة. وما إلى ذلك). ويتطلب تمكين قياس التغيير في 
التعدادات السكانية الاستمرارية فيما يتعلق بالأسئلة المطروحة فيها والكيفية التي تدار 
بها هذه التعدادات. وفي ذات الوقتء يتطلب التقاط البيانات الجديدة موضع الاهتمام 
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والتي تعكس تغيرات أوسع في المجتمع: إجراء تغييرات على آلية هذه التعدادات. مثل 
إضافة أسئلة جديدة أو التعديل على الأسئلة الأساسية (انظر الشكل :١-5‏ ولاحظ كيف أنه 
حتى عندما تم الحفاظ على الأسئلة عبر التعدادات السكانية المتعاقبة: فإن كيفية صياغتها 
كانت غالبا ما تكون مختلفة تماما في كل مرة). وعلاوة على ذلك: فإن الكيفية التي 
يدار بها التعداد السكاني كانت تتشكل في التعدادات المتعاقبة من قبل قوى مؤسسية. 
وسياسية:. واقتصادية. وتطورات تقنية جديدة : انظر 1991) تهطءض1.]آ) للتعرف على 
تاريخ التعداد السكاني الايرلندي من 1١817١‏ -1511. و2012) غ12111211) لتحليل التعداد 
الكندي من .50١١ - 181١‏ علاوة على ذلكء. يتعرض التعداد للطعن والتفاوض حيث 
تتنافس مصالح خاصة لضمٌ» أو تغيير. أو إزالة الأسئلة منها. وفي بعض الحالاتء يمكن أن 
تكون التغييرات ا مطلوبة جذرية بشكل متطرفء مثل القرار الأطاني بوقف إجراء التعداد 
السكاني في الثمانينات (انظر 2011 285هه]]). ونتيجة لذلكء يرزح التعداد الوطني دائماً 
تحت وطأة التوتر الناتج عن الاستمرارية والتغيير. ومع ذلك يتطور مع مرور الوقت وفي 
مناطق حغرافية مختلفة. وحتى الآن» ومع ذلك. فقد كان هناك عدد قليل من مجاميع 
البيانات المميزة فاريقيا ممقراقيا (:2011 طلمسسصدط 1988 وعنغ 1ومئوء12 :2002 معل1م 
5 2ع201 :1998 200177 :2012 غغ1نمهأكتتهآ :2010 أختوعلط). 
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)١-9 شكل‎ 


الأسئلة المتعلقة بالأفراد خلال التعداد السكاني الايرلندي للسكان ما بين 186١‏ - 1991 


الإقامة في الخارج 


سم > جد اس هاس وعد لزنلا رك 


المنطقة 


مجال العمل (صاحب عمل آم موظف) 
الوضع الحالي 


عنوان مكان العمل» المدرسة» الخ 


نيتم (للطفال) 


الأبناء من آخر زوجة على قيد الحياة 
آنواع المدارس 


سن التوقف عنده عن الدراسة النظامية 


سعة النماذج/ آعداد الأشخاص 

الاسم الأول وآسم العانلة 

أعضاء الأسرة الفاتبين 

حالات الوفاة في الأسرة منذ آخر تعداد 
فترة البطالة للعام السابق 

المؤهلات العلمية آو التكنولوجية 
الإقامة المعتادة الآن 

الإقامة المعتادة قبل عام واحد 
وسائل التنقل للعمل أو المدرسة: الخ 
المسافة إلى العمل: المدرسة:؛ الخ 
الإقامة في العام الماضي 


مستوى الأمية (معرفة القراءة والكتابة) 
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ال مصدر : منقول بتصرف عن 1991 72هطعضاءآ. 
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المنظور الفلسفي (117دع1طامرهده1نطط): 

بالنسبة للبعضء تعد البيانات على ا مستوى الوجودي (اع147 1ه0121010816) حميدة 
(غير خطرة). فالبيانات هي مجرد بيانات» وعناصر أساسية يتم استخراجها من العام 
بطرق محايدة وموضوعية تخضع لقيود تقنية. فهي "لا تمتلك أي معان ضمنية كامنة 
فيهاء ولا تقدّم بالضرورة أي تفسيرات أو آراءء ولا تحمل خصائص دلالية قد تكشف عن 
أهميتها وصلاتها " (2010 5121512 10132 20 010غم210 -26:2).: فهي تخمينية قابلة 
للتحليل. ومن هذا ال منظورء فإن جهاز الاستشعار (562507) على سبيل المثال ليس لديه أي 
سياسة أو جدول أعمال. فهو ببساطة يقيس الضوء أو الحرارة أو الرطوبة: ...الخ - حيث 
يقوم بإنتاج القراءات التي تعكس حقيقة الواقع عن العالم المحيط مالم يشوبه خلل فني. 
وبعبارة أخرى. ثنتج أجهزة الاستشعار نظرة موضوعية واقعية عن العالم وتكشف عن 
الأشياء كما هي في الواقع» حيث إن قياس واقعية الشيء هو مستقل عن عملية القياس له 
(1998 و6126 زومروء2). أما في إطار عمليات القياس التي يلعب فيها العنصر البشري 0 
مركزياً - في التجارب المخبرية» أو إجراء مسح ميداني أو مقابلة شخصية - فإن عمليات 
القياس تطبّق شكلاً من أشكال الموضوعية الميكانيكية التي تلتزم بقواعد محددّة, وطرق 
منهجية دقيقة لإنتاج بيانات منفصلة» غير متصلة» ونزيهة على نحو شفافء وخالية من 
تحيز الباحث وهواه وتفضيلاته. ومن ثم فهي مستقلة عن العادات. والتقاليد. والثقافة, 
والمعرفة. والسياق (1995 0:167). وعلى هذا النحوء فإن العلم عند ممارسته بشكل 
صحيح لا ينبغي أن يتلبس بأي دوافع سياسية أو أجندات خفية بحيث يمكن بعد ذلك 
أن تؤخذ البيانات على ظاهرها وعلاتها. وفي الواقع» تقترح المصطلحات المستخدمة عادة 
لتفصيل كيفية التعامل مع البيانات عمليات تقنية حميدة مثل: «الجمع» «الإدخال» 
«الترحمة». «التخزين»». «المعالجة»». و«التنقيب» (2013 2هدكاء2[ 0ه ندحصاءغ01). ولذا 
فإن استخدامات البيانات هي التي تخضع للإملاءات السياسية. وبعبارة أخرىء إن الناس 
هم من يفسدون البيانات ويعملون على تجييرها لمصالحهم الخاصة. وليس للعلم بحد 


ذاته. 
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وبالنسبة لآخرينء فإن هذا الرأي لا يمكن تبريره والدفاع عنه. إذ تتحدّد طبيعة البيانات 
بفعالية من خلال الكيفية التي يمكننا بها تصور البيانات» وقياسهاء والتعامل معها. فبالنسبة 
لهمء البيانات لمم تكن موجودة قبل إنتاجها؛ إلا أنها لا تنشأ من العدم. ويتمٌ إنتاج البيانات 
من خلال القياس. والتجريد والاقتباس. وتعميم التقنيات التي تم وضعها ضمن تصور 
لتنفيذ مهمة ما وتسجَّل في الأشكال وامقاييس التي تتفق مع المعايير التي اخترعها الناس 
على سبيل المثالء النظام المتري. فالبيانات هي وحدات معرفية. جعلت على نموذج تمثيلي 
لتمكين وإتاحة العمل ال معرفيء وقياس وتسجيل البيانات عن نفس الظاهرة من خلال 
العديد من الطرق والأساليبء التي يقدّم كل منها مجموعة مختلفة من البيانات التي يمكن 
تحليلها وتفسيرها باستخدام وسائل مختلفة (1998 تإع8007). فالكيفيات التي يتم إنشاء 
البيانات بها لا يمكن حصرها نظرا لتعدد التصاميم والنقاشات والتعديلات التي تطرأ على 
البروتوكولات. والعمليات التنظيمية؛ ومعايير القياس» والفئاتء والمعايير الخاصة بالبيانات 
في ظل الفوضي المصاحبة لعملية توليد هذه البيانات وإنتاجها. فلو أخذنا حالة قياس 
التعداد السكاني لبلد ما: فإن هنالك العديد من القرارات التي يجب أن تتخذ مثل تلك التي 
تحدد من يضاف للتعداد ومن يستثنى منه على سبيل المثالء أن يشمل الزوارء والأجانب 
المقيمين بصورة مشروعة أو غير مشروعة: وأولئك الذين يتجنبون المشاركة عن عمد أو لا. 
وما إلى ذلك وأين يجب أن يتم تعدادهم على سبيل المفالء تعدادهم تبعاً لإقامتهم ليلة 
إجراء التعداد أو مكان إقامتهم الدائمة في العادة؛ فجميع أنواع القواعد والإجراءات يتم 
وضعها قبل التعداد. ومع ذلك يظل هناك أمور لم يتخذ قرارات بخصوصها واختلاف عبر 
العدّادين في طريقة التطبيق (1995 :250 ). 

ونتيجة لذلكء فإن الكيفية المتبعة لتعريف البيانات وتحديدها وجودياً ليست عملية 
فنية محايدة, ولكن معايرة سياسية وأخلاقية يجري التنازع عليهاء ولها نتائج قابلة 
للتحليلء والتفسيرء والعمل في وقت لاحق (1999 5682 له 1ع8011). ومع ذلك 
لمرة أخرىء تعمل تبويبات البيانات على استبعاد التباينات والتقلبات وتحديد ما يتاح 
ويحجب داخل مجموعة البيانات. وعلى الرغم من ذلكء. تكون هذه العملية من التقارب 
والاستقرار معرضة على الدوام للممانعة والرفض وإعادة الصياغة بسبب تعدد الجهات 
الفاعلة» وا موضوعات والعمليات موضع ال مناقشة والردء والتناقض الحاصل في البيانات 
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والذي لا يمكن تطبيقه بسهولة وما يتناسب مع نظام ما (1999 5682 له اععارده 8). 
وعلاوة على ذلك. فإنه مجرد إنتاج البيانات يكون من الممكن فرزء وتقسيمء وتكعيب 
هذه البيانات بطرق متعددة في عدد من الفئات. وبعبارة أخرىء فإن البيانات ليست 
مستقلة عن نظام الفكر والأدوات التي تدعم إنتاحها (1999 5681 220 1ع8011): فهذه 
النظم الفكرية مُطعّمة بافتراضات فلس فية ومعتقدات تمارس بشكل مختلف. فالواقع, 
وكما لاحظ (38 :2007) مهدعءه8 أنه في الوقت الذي يسعى فيه العلم إلى تصوير نفسه 
بالعامية والعموم: تبدو ممارسات العلوم محلية ومتباينة على نطاق واسع. ومن ثم فإن 
البيانات لا تمثل ببساطة واقع وحقيقة العالم؛ فالبيانات هي وحدات بنيوية حول العام 
(1998 تإ:200 :1998 وع10505181). من هذ المنظور «يتم إنتاج المعرفة العلمية - 
بدلاً من براءة اكتشافها» '(4 :2013 2هعاآء2[ 220 تهحصاءغ1). كما 2 التالي: 
إذا كان إنتاج البيانات عن طريق أداة مثل شبكة استشعار فإن تفسير 

هذه البيانات يتطلب فهم الأداة - على سبيل المثالء ما الذي تستكشفه أجهزة 

الاستشعار؟ وتحت أي ظروف؟ وكم عدد تكرار مرات الملاحظة؟ ومع أي نوع 

من المعايرة؟ (183 :2007 تهحدعده 8). 


ومع ذلك نجد أن العلم يحاول في كثير من الأحيان جعل البيانات حرة ومستقلة 
عن مثل هذا الفهم السياقيء وتنظيم ومشاركة البيانات من خلال قواعد البيانات التي 
يجري التحسين فيها والتخفيف من حدّة الفوضى عند إنشائها وحماية المستخدمين من 
معرفة كيفية إنتاج البيانات وتنظيمها (2013 2ه5عاء3[ 300 متدمماء]61). ولذلكء يبين 
(165 :2013) صطهوعاءد[ حصد وءعطنظ أن الاستخدامات العلمية للبيانات والقائمة على أنها 
محايدة وموضوعية هي مجرد تخيلات لا حقيقة لها؛ أنها «تفترض وتصور العام بناء على 
البيانات المتداولة دون النظر إلى مصدرهاء وحالتهاء وجوهرهاء وتاريخهاء ومن ثم تبرز 
هذه البيانات على أنها حرة للتنقل عبر العم كعملة غير متمايزة وعاطية». في المقابل. 
هما يؤكدان أن «البيانات هي أكثر ارتباطا من ذلك». 

ونتيجة لذلك» فالبيانات غير مسبقة التحليلء وليست عناصر موضوعية مستقلة. كما 
بينها (2 :2013) 2هوككء 2[ له تهحماء6نق). متبعين 2 ذلك بوكر (2005) 1ع80371 عندما 
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الفصل الأول 


ذكروا أن "البيانات الخام هي مصطلح متناقض؛ «فالبيانات هي على الدوام "مطهوة” 
سلفاء ولم تكن يوما "خاما" أبدا. فهناك حاجة لتصوّر البيانات كما هي على الحقيقة في 
الوجود والعمل موجحب ذلك" (3 :2013 دهوكاء2[ 220 مدحطاءغ01). فالبيانات - على 
حدٌ سواء - هي اجتماعية من باب أنها تقع ضمن السياقء ومادية من باب أن لديها 
شكلاً (كأرقام ثنائية» أو رموزء أو أعداد... وما إلى ذلك)» ويجري تخزينها على الورق» 
والأشرطة الممغنطة. والأقراص الصلبة. وما إلى ذلك (220 سهحصاءغ1© :2011 حده5ل1171 
3 د<ووؤعاء2[). كلا ا منظورين يعمل على تشكيل القواعد التأسيسية للبيانات: فعلى 
سبيل امثال» تعتمد البيانات الكبيرة على النقاشات الأخلاقية, والاقتصادية. والسياسية في 
المجالات المختلفة التي تدعم البدء في اعتمادها وتنفيذها (انظر الفصل السابع)» وتعتمد 
على قواعد البيانات» والحواسيب. والخوادم» وشبكات الاتصال التي تمكن بدورها عمليات 
إنتاج البيانات» ومعالجتها.ء ومشاركتهاء وتحليلهاء تخزينها (انظر الفصل الخامس). وتسهّل 
هذة الوياقط فساه البيانات (تعفتها)» وسوه موضعياء أو تسيائهاء أو حذفهاء أو تاكلها 
من خلال تلف الوحدة التخزينية للأرقام الثنائية - بت (أي تعطل وسائط التخزين نتيجة 
تحثل الأشرطة الممغنطة أو تضرر الأقراص الصلبة) (2013 80115:0:8). وفي الواقع لم 
تكن البيانات قط مطهوّة فقطء ولكنها أيضاً منفتحة لتقبّل أساليب «غير مخطط لهاء وغير 
متوقعة, وعرضية»» و«متحولة بأشكال شبة إنسانية معقدة, وطرق زمانية ناشئة لا تتبع 
على الدوام وصفة حسابية محددة مسبقاً» (42013:ه806115). 
ونظراً للطبيعة الاجتماعية والمادية للبيانات, فإننا ننشط في إعادة صياغة وتشكيل 
«عواطنا اطادية» والتقنية.» والجغرافية» والتنظيمية. والاجتماعية إلى نوع من البيئات 
التي يمكن للبيانات أن تزدهر فيها... والوصول إلى العلاقة التكافلية مع البيانات» 
(152 :2013 صهعاءج[ حصه د5ءط13). ومن ثم وبينما ينظر إلى البيانات بوصفها شيئاً 
موجوداً - شيئاً حول الواقع (2013 5035: التأكيد الأصلي). فإن الفهم الأكثر إنتاجية 
للبيانات هو اعتبارها أحد مكوّنات الواقع وأحد مُنتجي الواقع في ذات الوقت. إن 
البيانات ليست محض فكرة تمثيلية مجردة. بل هي تأسيسية: وإنتاجهاء وتحليلها. 
وتفسيرها له نتائج وعواقب تتبعها. وكما بين (2 :2013) طهعاءع2[ لطنه تممصساءغزى: 
«إذا كانت البيانات تخضع لناملريقة أو بشو قإتنا تع ألكاً نخضع للبيانات». 
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تصور مفهوم البيانات 


حيث يتم م التقاط البيانات من العاط, ولكن في المقابل تعمل في العالم. إن البيانات مم 
تكن ثوماء ولا مكن أن تكون. حميدة (2013 طقطد). بدلا من ذلك. من الضروري 
فهم «البيانات على أنها مؤطرة متأثرة بغيرها ومؤطرة مؤثرة على غيرها» (صدحصساء1© 
5 <تو5ع1ء2[ 20ة). وبعبارة أخرىء. هناك حاجة إلى ما هو أكثر من مجرد 
الاعتراف العام من قطاعي العلوم والأعمال لأهمية التصور المفاهيمي للبيانات. 


التفكير النقدي حول قواعد البيانات والبنى التحتية للبيانات: 

قٍِ العادة, يتم تجميع البيانات في مجاميع (10325665) في محاولة لفهم البيانات» والتي 
غالباً ما يتم تنظيمها وتخزينها في قواعد بيانات (وهي وسيلة لتنظيم وتخزين البيانات 
التي يمكن الاستعلام عنها بطرق متعددة) وبنى تحتية للبيانات مثل نظم ا لمحفوظات 
الأرشيفية (وعانطءءة) وحاويات البيانات (86205160165) (انظر الفصول الثاني والثالث 
والخامس). وكما كان الحال مع التصور المفاهيمي للبيانات بشكل عام فمن المهم كذلك 
التفكير بشكل نقدي حول طبيعة قواعد البيانات والبنى التحتية للبيانات» وإنتاجها من 
الناحيتين الاجتماعية والتقنية ([هعنصداءع5060-1): وكيف أنها تعكس العقلانية حول 
العالم في الوقت نفسه لأنها تتكاثر وتعزز هذه العقلانية. وكان هذا التفكير النقدي غائباً 
إلى حد كبير فيما يتعلق بالبيانات الكبيرة» والبيانات المفتوحة: والبيانات الصغيرة الموسّعة, 
مع التركيز حتى الآن عليه ليكون ذا طبيعة تقنية وآلية بشكل أكبر. 

وتمتدٌ الفرضية المطروحة التي تم” تبنيها وتطويرها في جميع أنحاء هذا الكتاب من الحجة 
المبنية في القتسم الأخيرء وهي الافتراض بأن قواعد البيانات والبنى التحتية للبيانات ليست 
ببساطة محايدة. أو وسائل تقنية لتجميع وتبادل البيانات؛ وليست بالتأكيد منتجات لتخزين 
البيانات الملتقطة عن العام ولكنها حزم من العمليات الطارئة والمترابطة التي تقوم بتأدية 
الأعمال في العام (2011 عع200 لصة صنطءغك]1 :1996 معلء1طتحظ لصح عهغ5). إنها أنظمة 
اجتماعية تقنية معقدة كامنة كجزء لا يتجزأ ضمن ا مشهد المؤسساق الأكبر من الباحثين» 
والمؤسسات. والشركاتء التي تشكل أدوات أساسية في إنتاج المعرفة والحكم ورأس امال. 

ويتمّ تصميم وبناء قواعد البيانات على تقبّل أنواع معينة من البيانات وتمكين أنواع 
معينة من التحليلء ولذا فهنالك آثار عميقة مترتبة على الكيفية التي يتم بها هيكلتها على 
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الفصل الأول 


الاستفسارات والتحليلات الممكن أداؤها؛ كما أن شروط صياغتها من شأنها أن تحدد العمل 
الذي يمكن القيام به عليها ومن خلالها (2012 61 مم1815). فعلى سييل امثال. يختلف 
تخزين البيانات في قواعد البيانات اختلافاً تاماً عن الشكل السردي من حيث ما تمّ تخزينه. 
وكيف يتم تخزينه» وكيف من الممكن استدعاؤها وإعادة استخدامها (2005 ع80171). 
وينتج عن قواعد البيانات إهمال وتجاهل لبعض البيانات» إضافة إلى الثغرات الكامنة في 
البيانات» وذلك كلما تم الكشف عن علاقات بين البيانات وتوفير الإجابة عن بعض الأمئلة 
التي يتعين الإجابة عنها؛ فهي تقيّد وتتيح من خلال وجودها (الأنطولوجيا). وثنتج العديد من 
العلاقات في ذات الوقت الذي يتم فيه إخفاء علاقات أخرى (2013 1715 :2012 4ع ممنا1). 
واستناداً إلى 62110, فقد جادل (12 :2005) 8010161 بأن قواعد البيانات وا محفوظات 
الأرشيفية هي المتحكم (055196(): فهي "تقول لنا ما نستطيع وما لا نستطيع أن نقوله" من 
خلال تحديد ما يمكن تذكره وما يجري تجاهله ونسيانه. فهذا التذكر والتناسي يتم تحديده 
في الأصل من خلال أنظمة وممارسات مبنية على قوانين سياسية وفلسفية. 

ومن هنا فإن التبويبات داخل قواعد البيانات غير ثابتة وغير طبيعية» ولكن يتم إنشاؤها 
من قبل جهات فاعلة ذات أهداف محددة تعمل ضمن مجتمعات ال ممارسة. أساليب 
الحوكمة. والقيود التقنية الفنية. ومن ثمء فإن قواعد البيانات هي تعابير عن السلطة / 
المعرفة وهي تقوم بإقرار تشريعها وإعادة إنتاج هذه العلاقات (2012 16ءممن16): على 
سبيل المثال. تحديد معدل التأمين لشخص ما أو ما إذا كان بإمكانه السفر بين البلدان. 
وعلاوة على ذلكء فإن قواعد البيانات هي كيانات ديناميكية متغيرة تقوم بإجراء «عملية 
مستمرة من التمييز والتفريق» (129 :2012 16عمم161) من خلال التفاعل مع مجاميعها 
المرتبطة بها (المنشئونء المستخدمون. البرمجيات, الأجهزة. الشبكات, وما إلى ذلك). 

وفي الوقت نفسه. عملت قواعد البيانات على فصل عملية تحليل البيانات عن البيانات 
تقسهاامق خلال مكن | عراة اد شعافبات وحساباث معقدة دون الحاحة إل إحراءهدة 
التحليلات التي تتطلب الاطلاع والعمل مع البيانات نفسها أو حتى فهم الكيفية التي 
تم من خلالها تجميع البيانات وتنظيمها (2013 5ه0و>كك2[ 20ه صدصحصاءغ01). وقد تم 
تعزيز هذا الفصل من خلال آليات مثل التوحيد العياري (5260 2101 مه 5) للصيخ 
والبيانات الوصفية والتعامل مع البيانات دون النظر إلى السياق الواردة فيه وبعيدا عن 
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التأثير السياسي (2011 مه11715). والأهم من ذلكء فإن هذا الفصل والتحرير للبيانات 
قد مكن السلطة / المعرفة المتعلقة بقواعد البيانات من الانتقال والانتشار وليتم توظيفها 
من قبل الآخرين بعيداً عن الأعمال الداخلية المعقدة فيها وتاريخها وسياسة الإنتاج لها 
(بالطريقة نفسها التي يستفيد فيها السائق من السيارة من دون معرفته كيفية صنع كل 
أنظمتها المعقدة أو ماذا تعمل أو كيفية تفاعلها لتشكيل تجربة القيادة). ومن ثم يمكن 
للباحثين الاستفادة من قواعد البيانات الحكومية مثل التعداد السكاني أو ال مسح التجاري أو 
المؤشرات الاقتصادية دون معرفة الدوافع السياسية لم وكيف تم بناء قواعد البيانات» أو 
الجوانب الفنية لإنتاجهاء أو وجود الألفة الشخصية مع الظواهر الملتقطة. على سبيل المثال» 
استخدام الوزارة الإيرلندية للبيئة لقواعد بيانات عقارية غير مكتملة في آيرلندا في مرحلة 
ما بعد الانهيار الاقتصادي 2008 (متوفرة على الرابط: 


ع12]5.2502ع تناح ه1ع7ع 151128-10 110 -0 »ع ج51 أ قطن روعء اع 01115 /عا.ع صذسدامط ,م1 / /نصاغط) 


حيث كان للمرء أن يجري البحثء والتصور, والاستخلاص للنتائج حول العقارات في 
إيرلندا دون أي معرفة مسبقة عن تاريخ وسياسات المسح, وكيف تم القيام به. ودون زيارة 
أي من تلك العقارات (انظر ط ,20128 ..21 ]© صنطاء1؟1). فمثل هذا التحرير والفصل مكن 
من العمل مع قواعد البيانات على أنها غير متغيرة ومستقرة وقابلة للتحول والنقل عبر 
المكان والزمان (1989 :تتامغة.آ). 

وتستضيف البنى التحتية للبيانات قواعد البيانات وتصل بينها لتشكل بنية تقنية 
اجتماعية أكثر تعقيداً. وكما هو الحال مع قواعد البيانات: لا يوجد شيء كامن أو مُعطى 
حول كيفية تكوين هذه الهياكل الأرشيفية والتشاركية. وفي الواقع. وكما نوقش في جميع 
أنحاء الكتاب. تعرّض تصميم وإدارة البنى التحتية للبيانات إلى تحديات تقنية وسياسية تم 
التصدي لها من خلال نقاشات فوضوية ومفاوضات عبثية تمت في سياق أتصف بالعديد 
من الأجندات (جداول الأعمال) والقولبة الحكومية» فالحلول التي تمّ إيجادها والمتعلقة 
بالمعاييرء والبروتوكولات» والسياسات. والقوانين كانت بطبيعتها ذات آثار تقريبية كونها 
هدفت إلى تثبيت أرضية مشتركة وتعميم الممارسات ونشرها بين المطورين والمستخدمين 
(2012 غ1.21112131): والتمويه على وتخفيف حدة التوتر والتباين بين قابلية الاستخدام 
وإتاحته والحدٌ من التخصيص وتقييد الابتكار. ومنع الطرق البديلة لهيكلة وترتيب البيانات 
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الفصل الأول 


(1996 علء1[طنآ سه :5غ5). وبالنظر إلى حدة التوتراتء» ينبغي التأكيد على عمليات 
التقريب باستمرار وبشكل متكرر من خلال التطبيقء والإدارة. وأنظمة الحوكمة (200 5:1 
9 ,ملصهامصمآ). لذلك؛ أكد 112 :1996) معلء[طن قصه عهؤ5) بأنه «لا وجود لمركز 
مطلق يصدر منه التحكم والمعايير؛ وكذلك, لا أطراف مطلقة ... مع كون البنية التحتية 
شيء ظاهر للناس في الممارسة العملية. ومتصلاً بالأنشطة والهياكل». 


فهذا الظهورء وعلى الرغم من عدم تركزه بشكل كاملء ليس شكلاً حراً وهو يتشكل 
من خلال علاقات بنيوية واسعة. فقد حادل(2001) 8125015 لخنه مسهقطهة 0 بأن البنى 
التحتية هي تأسيسية نتيجة «تراكمات بعيدة المدى من التمويلء والتكنولوجياء والدراية, 
والسلطة التنظيمية والجيوسياسية» (ص. 12) والمحافظة على «الهندسة الفنية الاجتماعية 
للسلطة» (ص. 11) من المصالح الاجتماعية المتحجرة. وتشمل هذه التراكمات أنظمة من 
التشريعات تسعى من الناحية القانونية ومن خلال أشكال الحوكمة لتحديد كيفية إدارة 
وتحليل ومشاركة البيانات, على سبيل المثال قوانين حماية البيانات (انظر الفصل العاشر). 
ولذلك. اقترح (8 :1987) 2ةغ5 أن البنية التحتية للبيانات لديها: 

نوعان من الهياكل التنظيمية - الاجتماعية وا معرفية: فالتنظيم الاجتماعي يتكون من 
العلاقات الاجتماعية والاقتصادية لأفراد العينة ال ممثلة: وأجهزة الدولة: والشركات الخاصة, 
والمنظمات المهنية والدولية» وغيرهم من المشاركين في إنتاج تدفقات البيانات من مصادرها 
الأصلية وحتى نقاط التحليلء والتوزيع. والاستخدام: في حين يشير التنظيم المعرفي لهيكلة 
البيانات نفسههء بما في ذلك حدود الاستعلام: والافتراض عن الواقع الاجتماعيء وأنظمة 
التصنيف. وطرق القياسء والقواعد الرسمية لتفسير وعرض البيانات. 

كنا أكذ (2007) 811 20د طاوتهتاه12 أنه لا مكن النظر بصورة صرفة لقواعد البيانات 
والبنى التحتية كوسائل وأدوات ثانوية لأنها تشمل بطبيعتها نواحي ثقافية» واقتصادية, 
ومعرفية» وهي غارقة في الأهمية على المستوى الاجتماعي. ولذلك اقترحا منظورين يمكن 
من خلالها فهم البنى التحتية للبيانات: المنظور الأول يتضمن قراءة اجتماعية سياسية 
يدرس من خلالها «بلورة العلاقات المؤسسية» (ص. 416). أما ال منظور الثاني فهو القراءة 
التجريبية التي تدرس " كيفية تشكيل البنى التحتية للبيانات لإجراءات الأفراد وخبراتهم" 


01 ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها 


تصور لمفهوم البيانات 


(ص. .)2١١‏ وفي كلتا الحاتين» تفهم البنى التحتية للبيانات ككيانات مترابطة. ويُعيد هذا 
الترابط تشكيل العام بشكل عرضي بناء عليها. وهي بدورها تتشكل من قبل العالم كذلك. 
ولي نصل إلى استخدام قواعد البيانات والبنى التحتية للبيانات والاعتماد عليها لفهم 
العالم والقيام بأعمال فيه فإن ممارساتنا المنطقية والمادية تتكيّف وتتمحور كاستجابة لهما 
(1996 ع11160 مضه عهغ5). ولا ينعكس العام في البيانات فقطء بل يتغير بها؛ «فالعمل 
على إنتاج وحفظ وتبادل البيانات ومشاركتها يقوم بإعادة تشكيل العواط التنظيمية, 
والتكنولوجية, والثقافية من حولهم» (147 :2013 دهىكاء2[ لصه وءط11). 

وبعبارة أخرىء لا تدعم قواعد البيانات والبنى التحتية للبيانات البحوث ببساطة, 
ولكنها تغير وبشكل جذري الممارسات والنظم البحثية - الأمئلة المطروحة» وكيفية طرحهاء 
وطريقة الإجابة عليهاء وكيفية تطبيق الإجابات» ومن يجري البحث وكيف يعملون بصفة 
باحثين (انظر الفصل الثامن). فعلى سبيل المثالء وفي دراستها لتطور التعداد السكاني 
الكندي وأطلس كنداء بيّنت (2012) 1,311131116 بالتفصيل كيف تطور كل تعداد بشكل 
متواتر ومتكرر على أساس نماذج للعالم شكلت طرقاً لتصور وعرض كندا. وقد جادلت بأن 
محفوظات البيانات والبيانات نفسها تشكل «نظام ذاكرة خارج الجسم المؤسسي يسمح 
بسرد قصص عن طبيعة كندا... من خلال الخرائط والرسوم البيانية والنماذج والإحصاءات 
التي تعتمد على أجهزة الاستشعارء والبيانات» وقابلية التشغيل البيني» ومعايير رسم 
الخرائط على شبكة الإنترنت» والبوابات الإلكترونية» والبيانات الوصفية والنماذج: والعلوم, 
والهياكل المفتوحة» (ص. /71). في المقابلء تعدّل هذه القصص النماذج الأساسية ومن ثم 
البنية التحتية للبيانات. مما يعمل على تحوير الوسائل التي يتم من خلالها إنشاء القصص. 

ويتطلب تفهم قواعد البيانات والبنى التحتية للبيانات التفكيك والتفريغ بعناية لطبيعة 
نشوتهاء وتداخلهاء وعلائقيتهاء. وسياقيتها (1996 12ع0ع1طتآ 2120 1).. وهذا يعني البحث 
فيما وصفه (34 :1999) غ5 عطنهة تزاعع][د0 8 بأنه انعكاس الأساس ([128اأع1تافة لمآ 
:15 أي أن ندرك أعماق الترابط بين الشبكات التقنية والمعايير الفنية من جهة, 
والعمل الحقيقي للسياسة وإنتاج ا معرفة من جهة أخرى. وكما بيّنت (2012) 121116 تاه 
فإن هذا مظلي أيقا تعليلا تاريقيا نوق كف قطور قواعه البيافات والتن الععية 
للبيانات مع مرور الوقت وتغير المكان. 


ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة, والبنى التحتية للبيانات, والنتائج المترتبة عنها 0 


الفصل الأول 


مجاميع البيانات وثورة البيانات (127011102 10262 عط لصه دعع2[طصءودة 12262) : 

كان الجدل والحجة الرئيسية المعروضة في هذا الفصل بأن التفكير بالبيانات لا يكون 
بالطريقة ال مباشرة, ولا يمكن أن توجد البيانات بشكل مستقل عن الأفكارء والآليات. 
والتقنيات, والنظم, والناسء والسياقات. بغض النظر عن كونها في كثير من الأحيان يتم 
تصورها بهذه الطريقة (2013 05وعاء2[ 320 5ءط131 :2012 غ1112111ة.1). فالبيانات يتم 
إنشاؤها بوصفها نتاجاً لكثير من العقول العاملة في مختلف الحالات والأوضاع؛ وهي مؤطرة 
وتتشكل في ظروف وهياكل مختلفة. 

ولذا فإن من طرق فهم البيانات هو التفكير بها كقضية مركزية لتجمّع فني 
اجتماعي معقد., ويتكون هذا التجمع للبيانات من العديد من الأدوات والعناصر 
التي تزداد تشابكا وتطوراً وتتحوّر مع مرور الزمن وتبدّل المكان (انظر الجدول1-3). 
وتصوغ كل أداة مصحوبة بعناصرها ما هو ممكنء وما هو مطلوبء وما هو متوقع 
من البيانات. وعلاوة على ذلكء فهي تتفاعل بعضها مع بعض ويشكل بعضها بعضاً 
من خلال شبكة معقدة ومتغيرة من العلاقات المتعددة الأوجه (انظر الشكل 1-3). 
وكما اذعى كل من (2013) 2هككاءد[ هته 5ءطن2. فإن هذه الأدوات لا تقوم بتأطير 
ماهية وكيفية إنتاج البيانات وإلى أي حدّ من ال ممكن توظيفها فحسب. ولكنها بحذ 
ذاتها منظمة ومدارة لتقوم بإنتاج مثل هذه البيانات. وعلى ذلك. فإن البيانات 
ومجاميعها تتشارك التحديد (01520115اةء]اء200-0) وتتبادل عملية التشكيل كل منها 
للآخر(0ع002511616) :2/11612117): وترتبط ببعضها من خلال مجموعة من الممارسات 
والعلاقات المنطقية والمادية الطارئة» والعلائقية. والسياقية. وعلى ذلك. يختلف كل 
تجميع للبيانات في نسق ترتيب العناصر وسياقهاء ولكنها تتشارك في قواسم مشتركة 
وتأثير كل منها في الآخر بسبب اعتماد الأدوات على بعضها وتداخلها والاتفاقيات التي 
تغطي مجاميع البيانات. ومع نشوء أفكار ومعارف جديدة: واختراع التقنيات» وتطوير 
ا مهارات» وانفتاح الأسواقء فإن مجاميع البيانات تتطورء وتتحوّرء وتندمج» وتتفكك. 
ونتيجة لذلكء هناك تنوع كبير من تجمعات البيانات عبر النطاقات والاختصاصات 
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الجوانب الإدارية 
والقانونية 


الأصول المادية والبنى 


تصور مفهوم البيانات 


جدول رقم )١١7(‏ 


الأدوات والعناصر لمجاميع البيانات 


ا منطقيات.... إلخ. 
النصوص البحثية: الأدلة, المجلاتء المواقع الإلكترونية: الخبرة. الخطبء 
منتديات الدردشة.... إلخ. 


نماذج الأعمالء الاستثمارء رأس امال الاستثماريء المنح, التبرعات والصدقات» 
الربح.... إلخ. 

السياسة. الأنظمة الضريبية» الرأي العام والرأي السياسيء الاعتبارات 
الأخلاقية.... إلخ. 


معايير البيانات: صيغ الملفات. متطلبات النظم. اللوائح البروتوكولية, 
القوانين» الترخيصء أنظمة الملكية الفكرية.... إلخ. 

الأوراق / الأقلام. الحاسبات الآليةء الخدمات الرقمية, أجهزة الاستشعارء 
التقنيات. طرق التنفيذ. السلوكيات المستفادة: الاتفاقيات العلمية.... إلخ. 
سجلات الأرشفة. الشركات, المستشارونء ال مصنعون:ء بائعو التجزئة, الجهات 
ا مجتمعات الممارسة.... إلخ. 

منتجو البيانات. القيّمون على البيانات, المديرونء المحللون. العلماء. 
السياسيون. امستخدمون. اطواطئون.... إلخ. 

مجمعات الأعمالء.... والقوى البشرية المتصلة بها. 

الخرائط). والمحللون» وبرمجيات التحليلء والتفسيرات.... إلخ. 
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الفصل الأول 


فهذا الكتاب يبحث في تجمعات البيانات الناشئة: والمتطورة: المنتجة للبيانات المفتوحة 
والبنى التحتية للبيانات, والبيانات الكبيرة» وللقيام بذلك يطرح الكتاب ثلاث مسائل رئيسية 
للمناقشة: أولاً هناك حاجة لتطوير طرق مبدئية وفلسفية لفهم البيانات. فهناك نقص 
ملحوظ في التفكير النقدي والبحثي عن البيانات وفي البيانات بحدٌ ذاتها من حيث التكوين 
والتشغيل للمجاميع المحيطة بها وعلى الخصوص بالمقارنة مع التركيز والاهتمام اللذين 
تحظى به مفاهيم المعلومات وا معرفة. وذلك على الرغم من أن البيانات هي عنصر أساسي 
في إنتاج المعرفة. ثانيا هناك ثورة بيانات جارية تعمل على تشكيل لحظة حاسمة في تطور 
وتحوّر تجمعات البيانات. ونظراً لالتقاء العديد من التطورات الناشتة في مجال الحوسبة. 
والتقنيات المنهجية, والمجالين السياسي والاقتصادي, فإن حجم البيانات» وتنوعهاء وسرعتها. 
ودقتهاء وتوافرهاء والكيفية التي يتم بها معالجة البيانات وتحليلها وتخزينها وتوظيفها 
لزيساذة القبضر وفعضيل القيفة: قد شهد تصولاً خذريا قالناء نقبرا كلق العحديات 
التقنية والأخلاقية والعلمية التي أثارتها ثورة البيانات» فإن هناك حاجة ملحّة لتطوير فهم 
مفصل لتجمعات البيانات الجديدة والناشئة التي يتم إنشاؤهاء ولذا تهدف الفصول العشرة 
التالية إلى توفير نظرة إجمالية على نطاق واسع. وشاملء ودقيق لهذه التجمعات وتسليط 
الضوء على القضايا التي تتطلب مزيداً من الاهتمام والبحث. 


37 ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة, والبنى التحتية للبيانات, والنتائج المترتبة عنها 


تصور مفهوم البيانات 


شكل )١-7(‏ 
التقاطع بين أدوات مجاميع البيانات 
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ا 


الفصل الثانى 
البيانات الصغيرة (12262 511211)ء والبنى التحتية لديانات 
(111251111©14111:5 10242): ووسطاء البيانات (25ع>21201 12262) 


قبل بضع سنوات مضت كان مصطلح «البيانات الصغيرة» نادر الاتخدام إن لمم يكن 
عدوم وقد ذاع انتشاره مضطلها بحكم الواقع على النقيض مما سمي «البيانات الكبيرة». 
فكل البيانات كانت في الواقع بيانات صغيرة ومن ثم لم تتطلب تمييزها بهذا الإصطلاح. 
وسيجري لاحقا مناقشة ما قام على تأسيس البيانات الكبيرة بالتفصيل في الفصل الرابع» 
ولكن من الضروري تسليط الضوء على الفرق بين البيانات الصغيرة والبيانات الكبيرة. وذلك 
قبل التوجه إلى مناقشة كيفية تحّل البيانات الصغيرة من خلال البنى التحتية الجديدة 
للبيانات والأسواق امقدّرة ببلايين الدولارات» كما سيتم لاحقاً في الفصل التالي مناقشة 
انفتاحها لتقبل المشاركة وإعادة الاستخدام. 

فمن الناحية التقليدية:» ونظراً للتكاليف والصعوبات المصاحبة لعمليات إنتاج ومعالجة 
وتحليل وتخزين البيانات» فقد تم إنتاج البيانات الصغيرة بطرق مضبوطة بأحكام باستخدام 
تقنيات أخذ العينات التي تحدّ من نطاقهاء وصلاحيتها الزمنية. وحجمها (2010 111168 .[:11). 
وينتها مكن أن كين عض :قواعن البيانات كنوة دا في الحجم, مثل قاعدة بيانات التعداد 
الوطني» ولجعل ممارسة تجميع هذه البيانات قابلة للإدارة» فإن عملية إنتاجها عادة ما تتم 
خلال بضع سنوات وتكون محدودة النطاق (في حالة التعداد. يجرى في العادة مرة واحدة كل 
عشر سنوات ويكون مقتصراً على ثلاثين إلى أربعين سؤالاً فقط). وعلاوة على ذلك فقد كانت 
دقة البيانات الصغيرة العامة (12:8 :رهذ]ع1' 11هدم5) في كثير من الأحيان ضعيفة جداً (كانت, 
على سبيل المثال. على مستوى المقاطعات أو الدول وليس الأفراد والأسر). كما أن الأساليب 
المستخدمة لإنتاجها غير مرنة على الإطلاق (على سبيل المثال» من المستحيل تعديل الأسئلة أو 
الإضافة لها أو الإزالة منها بمجرد التهيئة للتعداد وإعداده والبدء بإدارته لأن ذلك سينعكس 
سلباً وبشكل جديّ على القدرة على المعالجة والتحليل). وفي المقابلء تتميز البيانات الكبيرة 
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الفصل الثاني 


بكونها تنتج بشكل مستمرء وتسعى لأن تكون شاملة وغارقة في التفاصيل ودقيقة على مستوى 
النطاق الذي تغطيه؛ ومرنة وقابلة للتطوير في عملية إنتاجها (انظر الجدول 2-1 والفصل 
الرابع). 
جدول رقم (١-؟)‏ 
مقارنة البيانات الصغيرة والبيانات الكبيرة 
2-22-2022 


3 

وفي الوقت الذي تعد فيه البيانات الصغيرة واحات صغيرة ضمن صحارى البيانات» 

تنتج البيانات الكبيرة طوفان بيانات حقيقي. وقد أذى ذلك بالبعض إلى التساؤل عما إذا 
كانت البيانات الكبيرة قد تؤدي إلى زوال البيانات الصغيرة أو تضاؤل مكانة الدراسات التي 
تعتمد على البيانات الصغيرة نظراً لمحدوديتها في الحجم, والنطاق: والصلاحية الزمانية. 
فقد لاحظ (2008) 53:07:61 أن وكالات تمويل البحوث الأكادمية. على سبيل المثال» توجه 
موارد التمويل المحدودة الخاصة بها إلى مجالات البيانات الغنية على نحو متزايد. وذلك 
ربما بسبب التداخل بين حجم البيانات وسرعتها مع مقدار التبصر والتوظيف والقيمة, 
وأن هذه الوكالات تحول الأسئلة البحثية التي من الصعب أن تنتج بيانات كبيرة لجهات 
التمويل الأخرى المتعددة وتمنحها وضع هامشي داخل وخارج هذه اللمؤسسات الأكاديمية. 
فغيدا عق البصوة الأساسة فقن المكدل هذا لسع فين خلال نوسة العدود من وكالات 
التمويل نحو البحوث التجريبية التطبيقية ذات الشراكة الصناعية. وقد أدى إعادة الترتيب 


ظ 
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البيانات الصغيرة» والبنى التحتية للبيانات» ووسطاء البيانات 


لأولويات البحث إلى سوء الفهم لطبيعة البيانات الكبيرة وقيمة البيانات الصغيرة» فالبيانات 
الكبيرة رما تهدف إلى أن تكون شاملة. ولكن كما هو الحال مع جميع البيانات فإن كليهما 
0 غن تمثيل لس وعينة (©1م532)»: فماهية البيانات التي يتم التقاطها 


٠‏ مجال إطار عرض/ أخذ العينات (حيث يتم توظيف أجهزة التقاط البيانات وماهية 
إعدادات التهيئة لها/ ومعاملاتها؛ مثل من يستخدم المكان أو وسائل الإعلام» وعلى سبيل 
المثال من الذي ينتمي إلى وسيلة التواصل الاجتماعي الفيسبوك أو يتسوّق في محلات 
وول مارت...إلخ). 

« التقنية والمنصة المستخدمة (المسوحات المختلفة. وأجهزة الاستشعارء والعدسات» 
والمطالبات النصية» والمخططات والتصاميم... إلخ وكلها تنتج فروقا وتباينات في ماهية 
البيانات التي يتم إنشاؤها). 

٠‏ السياق الذي يتم إنشاء البيانات فيه (الأحداث الجارية تعنى أن البيانات تقع واقا نشية 
إلى الظرف الذي تقع فيه). 

« تبويبات (أنطولوجية) البيانات ا مستخدمة (كيفية معايرة البيانات وتصنيفها). 

« البيئة التنظيمية فيما يتعلق بالخصوصية. وحماية وأمن البيانات. 


وتلتقط البيانات الكبيرة في العموم ما هو سهل التقاطه - أي البيانات التي يتم التعبير 
عنها علناً (ما كتبء وَمُرّ ومُسح ضوئياء وما تمّ استشعاره... إلخ؛ وتصرفات الناس وسلوكهم؛ 
وحركة الأشياء) - وكذلك البيانات المستنفذة والتي هي ناتج وظيفة رئيسية وليست المخرج 
الرئيسيء والبيانات الوصفية التي تمّ إنشاؤها تلقائياً. وتأخذ البيانات الكبيرة هذه البيانات 
بالقيمة الاسمية: على الرغم من أنها قد لا تكون قد تم تصميمها للرد” على أسئلة محددة 
والبيانات الناتجة قد تكون عشوائية وغير دقيقة (انظر الفصل التاسع). 

أما البيانات الصغيرة فقد تكون محدودة في الحجم والسرعة. ولكن لديها تاريخاً طويلاً 
من التطويرء مع منهجيات مقررة وأطوار للتحليلء وسجل حافل من الإجابات الناتجة للأسئلة 
العلمية. ويمكن لدراسات البيانات الصغيرة أن تكون مصممة بشكل أفضل بكثير للرد على 
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أسئلة بحثية محددة والاستكشاف اللمفصّل وامعمّق للطرق المتنوعة» والسياقية» والمنطقية 
وغير المنطقية التي يتعامل بها الناس» ويتم فهم العام بهاء وكيفية عمل العمليات العلمية 
(انظر الفصلين الثامن والتاسع). ويمكن أن تركز البيانات الصغيرة على حالات محددة وتخبر 
عن قصص فردية» وسياقية. ودقيقة. وبسبب أنها تستهدف ظاهرة معينة: فهي تركز بشكل 
مكثف على قضية وعادة ما تكون أقل حاجة للموارد بشكل مكثف: وتسعى دراسات 
البيانات الصغيرة على التنقيب عن الذهب من خلال العمل في شق ضيق للغاية» في حين 
تسعى دراسات البيانات الكبيرة إلى استخراج شذرات من خلال التعدين في حفرة مفتوحة 
وشفط وغربلة مساحات شاسعة من الأراضي. ومن ثم فقد برهن (2008) 530:6 على أن 
التمويل يحتاج إلى استهداف الإجابة عن الأسئلة الحرجة» سواء كانت معالجتها باستخدام 
بيانات صغيرة أو كبيرة» وليس مجرد أن توجّه نحو المشاريع التي يمكنها الوصول إلى كميات 
هائلة من البيانات على أمل أنها تحوي بطبيعتها رؤى وأفكاراً مفيدة. 

وهكذاء يمكن القول إنه من ا ممكن تحصيل المزيد من القيمة والرؤى من البيانات 
الصغيرة من خلال توسيع نطاقها إلى مجموعات بيانات أكبر. وجعلها متاحة لإعادة 
الاستخدام من خلال البنى التحتية للبيانات الرقمية والتي تجعلها إضافة إلى ذلك قابلة 
مختلف أشكال التحليل الحسابيء والحفاظ عليها للأجيال القادمة. ونتيجة لذلك: وكما هو 
الحال مع البيانات الكبيرة فقد استثمرت موارد كبيرة في السنوات الأخيرة لإنشاء مثل هذه 
البنى التحتية للبياناتء والتي أحدثت تغييرات كبيرة في مشهد البيانات. 


حاويات البيانات (21010111285 10262), محفوظات البيانات (وعكقطاء12:ة 2)10212 
والبنى التحتية للبيانات (111©5] 1121112510311 10262): 

تم جمع البيانات معا وتخزينها لفتزة طويلة من التاريخ ال مسجلء وقد كانت هذه 
ا ممارسات غير رسمية ورسمية على حدّ سواء في طبيعتهاء فا ممارسات غير الرسمية تتكوّن 
ببساطة من جمع البيانات وتخزينهاء في حين تتكوّن الممارسات الرسمية من مجموعة 
ا ممارسات الفاعلة ذات العلاقة بإدارة دورة حياةة البيانات (011120102 10362) والهياكل 
امؤسسية ا لمصممّة لضمان الحفاظ على البيانات من أجل الأجيال القادمة. وقد يكون من 
الأفضل وصف اممارسات غير الرسمية بأنها حاويات البيانات: في حين أن ا ممارسات الرسمية 
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هي محفوظات (أرشيفات) البيانات. ويجريء في كثير من الأحيانء الخلط بينهما أو تستخدم 
بالتبادلء جنبا إلى جنب مع غيرها من ا مصطلحات مثل النسخ الاحتياطي («تكاءة8)» 
وبنك المعلومات 82212 121012261052): ومستودع البيانات (20516017ع11 10368): ولكن 
المحفوظات الأرشيفية تمتلك خصائص مميزة جداً عند أمناء المحفوظات (5):ت#نطءعف) 
اطهنيين. 

فالمحفوظات هي مجموعات رسمية منظمة من البيانات التي يتم هيكلتها وتوثيقها 
ونشرها بشكل فعالء مصحوبة بالبيانات الوصفية المناسبة لهاء مع التخطيط الفعال لقضايا 
ا محافظة عليها وإتاحة الوصول إليها وإمكانات اكتشافها (2013 .21 أء غ21118111.آ). 
فالمحفوظات تهدف بشكل واضح وصريح وطويل الأمد. للحفاظ على البيانات لإعادة 
استخدامها في المستقبل. إن مفهوم الحفاظء في هذا السياقء لديه استخدام خاص محدّد على 
أنه مجموعة من الأنشطة المدارة والمدعمّة «بالمبادئ. السياساتء القواعد, والإستراتيجيات 
الرامية إلى إطالة أمد الكائن (البيانات) من خلال المحافظة عليه في حالة مناسبة للاستخدام, 
سواء على شسكله الأصلي أم في شكل مُستدام أكثر ثباتاء مع الإبقاء على الشكل الفكري 
للكائن» (2013 ,2 1246124191:5). ويسعى الأرشيف للحفاظ على مجموعة سجلات كاملة, 
وليس مجرد البيانات؛ أي أنها تشمل كل الوثائق الداعمة والبيانات الوصفية وغيرها من 
المواد ذات الصلة التي تحتوي على تفاصيل المنشأ والسياق فيما يتعلق بكيفية إنتاج البيانات 
والطريقة التي ينبغي أن تعامل وتحلل وتفسّر بها. فالنهج المتبع في الحفاظ على البيانات 
مبني على الإدراك التام بآن التقنيات والبروتوكولات والمبادئ التوجيهية لأفضل الممارسات 
هي عرضة للتغيير والتقادم» بمعنى أن البيانات سوف تحتاج للتنقل والترحيل عبر منصات 
وتقنيات بسبب الابتكارات الجديدة التي تأني في السياقء كما يدرك النهج المتبع بأنه دون 
ممارسات فعالة لإتاحة وإعادة الاستخدام والمشاركة للبيانات فإن البيانات معرضة للتلف. 
أو الضياع. أو الحرمان من بياناتها الوصفية السياقية والوثائق الداعمة (:2007 مقسعده8 
2 داوذوة1). ويسعى المحفوظ الأرشيفي إلى توفير موارد جديرة بالثقة. من خلال الحفاظ 
على سلامة البيانات (7إ12]68116 ]102) مع مرور الوقت. 


وفي بعض الحالات. قد يلزم مؤتمنو البيانات (1156001225) 1032) ممسؤولية قانونية 
لحفظ وأرشفة البيانات بشكل مناسب لإعادة الاستخدام الحالي والمستقبلي: كما قد يكون 
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المؤتمن على الأرشفة والقائم عليها نفسه سلطة قانونية تشريعية. فعلى سبيل المثال» 
فإن المحفوظات الأرشيفية الوطنية والوكالات الإحصائية الوطنية هي الكيانات القانونية 
التي غهد إليها جمع وإنتاج وأرشفة قواعد بيانات محددة مثل السجلات الشخصية 
للأفراد والحسابات القومية» والتعدادات والمسوح السكانية. وينبغي أن تمتثل المحفوظات 
أيضاً للتشريعات المتعلقة بحقوق الوصول إلى البياناتء والخصوصية. والمبادئ الأخلاقية, 
وحقوق الطبع والنشرء ولملكية الفكرية. وتحديد المسموح لهم للوصول إلى البيانات وما 
يمكنهم القيام به من خلال تحديد الصلاحيات على البيانات. على سبيل المثال» في العديد 
من البلدانء من الممكن نشر سجلات التعداد في شكل إجماليء مع تقييد نشر السجلات 
الشخصية إلى ما بعد مئة عام فالالتزام بإتاحة الوصول وإعادة الاستخدام للبيانات لا يستلزم 
بالضرورة العمل على نموذج مفتوح (انظر الفصل الثالث)» ولكن ينبغي أن يتم ضمان توافر 
البيانات في ا مستقبل للمجتمع المستهدف بطريقة قانونية (2012 ,00515). إن المجتمع 
المستهدف هو عادة مجموعة معينة من العلماء أو المتخصصين في مجال السياسات الذين 
لديهم في العادة احتياجات محددة تماماً من البيانات. ومتطلبات وظيفية ودعم مما يعني 
أن حلول الأرشفة العامة ستكون ذات فائدة محدودة (2013 .21 )© 1.2112121014آ). 

ومن ثم؛ فإن محفوظات البيانات ليست مجرد مخازن بيانات أو أنظمة نسخ احتياطي 
(والتي تحفظ البيانات في حال حدوث أعطال على المدى القصير مثل عطل الوسط التخزيني 
أو الفشل التقني). ولكنها تُخططء وتنشّقء وتُدار وتوظف بفعالية من قبل موظفين 
متفرغين ومتخصصين يعملون على إضافة القيمة وضمان الاستمرارية. فهؤلاء الأفراد. إضافة 
إلى الكيان الإداري الوظيفيء مسؤولون عن الأرشفة إضافة إلى ثلاث مجموعات أخرى من 
الأطراف الفاعلة في عملية الأرشفة وهم: منتجو البيانات. ومستهلكو البيانات» والإدارة 
(2012 00525). فالمنتجون هم منشئو البيانات أو الكيان القانوني المسؤول عن إنتاجها؛ 
أما المستهلكون فهم مستخدمو المحفوظات, وأصحاب المصلحة المعنيون بها أو مجتمع معين؛ 
وأما الإدارة فهي الهيئة التي تقرف على العملية: وتوفن للأرفيق ميقاقا ونطاقاء ولكنها لا 
تأخذ و فقطا 2 عمليات الأرشفة اليومية (2013 .21 أ 111116تاه.آ :2012 0055). 
وتشكل هذه الدوائر مجتمعة كيفية بناء وتشغيل وتطوير الأرشيف مع مرور الوقت. 
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في المقابلء فإن حاويات البيانات هو مجموعة غير رسمية وغير نظامية من البيانات. 
وقد يعتد بعض منتجي البيانات أن النسخ الاحتياطي أو أنظمة التخزين تشكل محفوظات 
أرشيفية بحكم الواقع» ولكنها تفتقر إلى الجهاز المؤسسيء والتنظيمء والسياسات الرسمية 
النظامية (بالنسبة إلى المعاييرء وإتاحة الوصول إليهاء وإمكانية إعادة استخدامهاء وحقوق 
املكية الفكرية, وا معايير الأخلاقية, وإلى آخره)؛ وما يطمح إلى تحقيقه الأرشيف (2111121110.آ1 
3 21 )©). فقد تكون حاويات البيانات منتظمة ومَوجّهة: ولكن بدون قواعد صارمة 
أو أي خطط طويلة المدى تتعلّق بالمحافظة على البيانات وحفظهاء ودون أي التزام المشاركة 
البيانات وتبادلها أو جعلها متاحة لإعادة الاستخدام. وعلى الرغم من أن حاويات البيانات 
قد تلتزم بشكل جيد بمعايير البيانات المتوقعة:. إلا أن هذا الالتزام يفتقر إلى الاعتماد 
والمصادقة عليه ويفتقر إلى الوثائق الأخرى والبيانات الوصفية المناسبة. 

وقد فقدت معظم البيانات التي تم إنتاجها على مر التاريخ أو دُمّرت بسبب تخزينها 
في حاويات بيانات: وليس أرشيفاً أو لأنه تقرر الحفاظ على المعلومات المستقاة من هذه 
البيانات (مثل المقالات والكتب) التي كانت تعد أكثر قيمة. وتخزينها في المكتبات. وبشكل 
عام تم الإبقاء فقط على مجموعات البيانات الأكثر قيمة» مثل تلك المرتبطة بالممساعي 
العلمية والثقافية الأساسية والسجلات الحكومية. وال معاملات الاقتصادية» والعقود القانونية. 
وفي حالات النماذج؛ الفنون الكائنات ....إلخ والتي يمكن اعتبارها صوراً معينة من البيانات 
فقد تم تنسيقها وتخزينها بالأماس في المتاحف وصالات العرض جنباً إلى جنب مع البيانات 
الوصفية المرتبطة بها. وقد تم تخزين البيانات الخاصة بمعظم العلماء بشكل غير رسمي 
على ملفات وصناديق أو على مختلف محركات الأقراص الصلبة في مكاتبهم أو في منازلهم. 
وعندما يتقاعدون خارج الخدمة أو يتوفون يتم تدمير معظم آثارهم: ومعهم أي بيانات 
قاموا بإنتاجها. كما أن الغالبية العظمى من البيانات التي تم إنتاجها لأطروحات الدكتوراه 
تفقد بعد الانتهاء منهاء وغالباً لا يتم نشر حتى المعلومات المستقاة من البحوث. وعلاوة 
على ذلكء فإن مُمِوَلِي البحوث تاريخياً لم يطالبوا المشاريع التي قاموا بتمويلها بحفظ 
البيانات وتخزينهاء أو إن طلبوا ذلك فقد كان لفترة قصيرة من الزمن. وكما هو الحال في 
العديد من المشاريع التي بموّلها الاتحاد الأوروبي» يُشترط الاحتفاظ بجميع مواد المشروع 
بما في ذلك البيانات لمدة سبع سنوات. ولكن يمكن بعد ذلك التخلص منهاء وهو ما يتم في 
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كثير من الحالات. بسبب تكاليف التخزين والظن الغالب بأن المقالات الورقية الناتجة تمثل 


ومع تطور حلول التخزين الرقميء التي قللت التكلفة والمساحة التخزينية للاحتفاظ 
بالبيانات» فقد بدأ التخزين الطويل الأمد على نطاق واسع للبيانات الاعتيادية ا منخفضة 
التكلفة (انظر الفصل الخامس). فقد ظهرت أولى قواعد البيانات الرقمية التي ضمّت 
مجموعات البيانات في الخمسينيات والستينيات من القرن الماضي وكانت تنسّق البيانات 
2 هياكل ة أو هرمية منظمة (2012 11مء1015). ومع ذلكء فقد كانت هذه 
الترتيبات غير فعالة للبحث والاستعلام عن البيانات. كما تم تطوير قواعد البيانات العلائقية 
(042625255 11260221) ابتداء في عام 111١‏ من قبل إدغار كود (00040 تنوع80) وقد 
نظم خصائص البيانات المميزة (]4]]:101) في مجموعة من الجداول المترابطة. حيث يتشارك كل 
جدول بحقل بيانات واحد على الأقل مع جدول آخرء فعلى سبيل المثال» قد يكون رقم الضمان 
الاجتماعي هو الحقل المشترك بين جدولين (المفتاح التأشيري- »>1 104©:321) أحدهما يحتوي 
على التفاصيل الشخصية (مثل العمرء الجنسء الحالة الاجتماعية» والعنوان) ويحتوي الجدول 
الآخر على المتعلقات المالية» ويسمح رقم الضمان الاجتماعي بربط البيانات للاستعلام في 
كلا الجدولين ف وإنتاج بيانات جديدة مشتقة منهما. وإذا كان المفتاح المشترك عنواناً 
أوقاريكشاء فيمكن عندها وضع البيانات جغرافياً أو زفافيا لتخم مكدت قواهد الديانات 
العلاتقية فظيماً وامنودانها اكز فعالية وتعقيدا عن البيانات الهيكلية باستخدام لغات 
الامتعلام الهيكلية 501). وجنباً إلى جنب مع قواعد البيانات العلائقية سمح تطوير 
البيانات المجدولة (5]ع620556م5) بتنظيم وتخزين كميات كبيرة من البيانات الحسابية 
إضافة لتطبيق الصيغ والمعادلات عليها مما يؤدي إلى إنتاج بيانات مستقاة جديدة. وقد 
استكملت هذه الأشكال من قواعد البيانات. في السنوات الأخيرة» بقواعد البيانات غير 
الهيكلية (بلا استعلام .20501-) التي يمكنها التعامل مع كميات كبيرة من البيانات غير 
الهيكلية (انظر الفصل الخامس). 

ويكون إتشاك وقو مععوفات البباكات سهلاً في الحالات التي تنتج فيها البيانات ابتداء 
بصورة رقمية (نشأت بالكود الثنائي-ع2»0 57ةطنط)ء وأحيانا بطرق تلقائية ومؤتمتة. كما 
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أنها عرضة للخسارة بشكل كبير بسبب التقادم في البرمجيات وا معدات. وقد بين 11ممه0*0© 
(2012) اماع13 هسه أنه: «في حين يمكن لأي أحد التقاط كتاب كتب قبل مئة سنة؛ والنظر 
فيه. وقراءة صفحة منهء فإنه لن يكون ذلك بالمثل صحيحاً لقرص مرن يحتوي على ملفات 
نصية لبرمجيات وورد بيرفكت أنشئت قبل ٠١‏ سنة فقط». وف المقابلء ينبغي أن تحول 
الأفكال التناظرية/ التماثلية للبيانات إلى الصورة الرقمية الثنائية على سبيل المثالء مسحها 
ضوئياً أو إعادة تسجيلها وإدخالهاء والتي يمكن أن تكون مكلفة وتستغرق وقتاً طويلاء 
على الرغم من إمكانية أتمتة هذه العملية آلياً إلى حد ما. وقد حدّت التكاليف والنفقات 
ال مرتبطة بالرقمنة (101811581052) من حيث التكلفة المادية. وقت الموظفينء وا لمعدات 
ا متخصصة. من تطبيقها في العديد من المحفوظات الأرشيفية التناظرية التي تحتفظ بها 
المتاحف وال مكتبات وال مجموعات الشخصية الخاصة. وبينما كافحت هذه المؤسسات لتمويل 
أنشطة الرقمنة. فإن جهات خيرية غير ربحية مثل أرشيف الإنترنت (ع01.عءانطععه//:صقط) 
وتجارية مثل قوقل (©1ع6008©) تساعد على القيام بمثل هذه الأنشطة, وذلك باستخدام 
مواردها الذاتية أو تبرعات المحسنين من عامة الأفراد مما يجعلها متاحة مجانا للجميع 
(انظر الفصل الخامس). 

وفي جميع الحالاتء فإن البيانات ضمن حاويات البيانات الرقمية وا محفوظات الأرشيفية 
يمكن مشاركتها وإعادة استخدامها بسهولة وبتكلفة هامشية منخفضة: وذلك على الرغم 
من أنه من الممكن الحد فيما يتعلق بالوصول وإعادة الاستخدام بواسطة سياسات حقوق 
الملكية الفكرية. وعلاوة على ذلكء فإنه من الممكن معالجتها وتحليلها من خلال الأدوات 
الحسابية القوية: إذ أصبحت الإجراءات والحسابات التي كان من الصعب القيام بها يدوياً 
أو باستخدام التقنيات التناظرية على سبيل المثال: المسطرة الحاسبة التناظرية (51106 
5©لناة) ممكنة في غضون بضعة أجزاء من الثانية, وأكثر في بناء واختبار النماذج وأنظمة 
المشاكاة اللحقدة. كه مكق امضاريظ حاوياكة البيانات الزقدية وااسقوطات الأرقيقيةيها 
بسهولة نسبياً ومدّها إلى أشكال أخرى من البنى التحتية للبيانات. 


فالبنية التحتية للبيانات هي الوسيلة المؤسسية وامادية والرقمية لتخزين وتبادل 
واستهلاك البيانات عبر التقنيات ال مرتبطة بعضها ببعض. وعلى مدى العقدين ال ماضيين على 
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وجه الخصوصء فقد تم بذل جهد كبير لتطوير وتعزيز هذه البنى التحتية» والتي تأخذ 
عدة أشكال: الكتالوجات, والأدلة: والبوابات» ومراكز تبادل المعلومات. وا لمستودعات» 
وا مستودعات الرقمية الموثوقة. والبنى التحتية السيبرانية (5ع11أ1 اكه ص[ ءار 
7 .21 ]© لله تتهآ). وغالباً ما تستخدم هذه المصطلحات بالتبادل ويجري الخلط 
بعضها ببعضء وذلك على الرغم من أنها تمثل أنواع مختلفة من الكيانات (انظر الجدول 
2- على سبيل المثال). 

فالكتالوجات. والأدلة» والبوابات هي موارد مركزية تفصّل وتربط حاويات البيانات 
والمحفوظات الأرشيفية التي تحتفظ بها المؤسسات على المستوى الفردي. وقد توفر قوائم 
مفصلة إلى حدٌ ما عن مجموعات البيانات التي تضمّهاء كما يمكن أن تكون ممثابة مجاميع 
للبيانات الوصفية. ولكن لا يستضيف الموقع نفسه البيانات (2013 .21 اء 11منتتون*0). 
أما مستودع البيانات أو مركز تبادل ا معلومات فهو مكان مشترك لتخزين حاويات البيانات 
وا محفوظات الأرشيفية والوصول إليها. وقد توفر هذه المستودعات والمراكز بعض خدمات 
البيانات من قبيل البحث والاسترجاع: وإدارة البيانات ومعالجتهاء ولكن عملية إنتاج كل 
حاوية أو أرشيف تتم بشكل مستقلء ولذا فهي رما تفتقر إلى صيغ ومعايير وبيانات وصفية 
وسياسات مشتركة للبيانات. ومع ذلك. يسعى مستودع البيانات لضمان التزام كل أرشيف 
أو حاوية بمجموعة من ا مواصفات المطلوبة ويقوم بالمراجعة» والتدقيق» والتصديق على 
منح الشهادات لضمان سلامة البيانات وتعزيز الثقة بين المستخدمين (2012 «أوزقهة12). 
وعرّف (2013) .21 ]© 0”021011 نوعين من ال مستوعات. مستودعات الموقع الواحد التي 
تستضيف كافة مجموعات البيانات في موقع واحد, ويمكن الوصول إليها من خلال واجهة 
على شبكة الإنترنت» على الرغم من إمكانية احتفاظها بنسخ احتياطية أو مواقع مثيلة في 
أماكن متعددة. والمستوعات المتعددة المواقع التي تستضيف البيانات ضمن هيكل موحد 
يسمح بالوصول إلى مجموعات البيانات القانئمة في عدد من المواقع المؤسسية. 


فالمستوع الرقمي الموثوق (1620510177 10181621 1215660" - خ1101) هو مستودع 
مرخص بموقع واحد أو متعدد المواقع تتمثل مهمته في توفير وصول آمن وموثوق به 
للبيانات التي يديرها على المدى البعيد (2002 001:0 320 181:6). ومن أجل التأهل 
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كمستودع موثوق. فصلت (5 :2002) 001:0 220 11:0 الخصائص المطلوب توفرها في 

البنية التحتية لهذه المستودعات وهي كالتالي: 

٠‏ تقبل المسئولية عن الصيانة طويلة الأمد للموارد الرقمية بالنيابة عن المودعين» وما فيه 
مصلحة ال مستخدمين الحاليين والمستقبليينء والمستهلكين أو ا مجتمعات المعنية. 
البعيدء ولكن يحافظ أيضا على المعلومات الرقمية التي تقع ضمن نطاق مسؤوليته. 

٠‏ توضيح المسؤولية المالية وضمان الاستدامة. 
تصميم أنظمتها وفقاً للاتفاقيات والمعايير المقبولة والمعتمدة لضمان الإدارة المستمرة, 
والوصولء وأمن المواد المودعة داخلها. 

٠‏ وضع منهجيات لتقييم المستودع. وذلك للتأكد من تلبيته للتوقعات المجتمع من حيث 
الموثوقية. 

٠‏ إمكانية الاعتماد على البنية التحتية الخاصة بها وضمان تحمّل مسؤولياتها على ا مدى 

« امتلاك السياسات. والممارسات,. والأداء الذي يمكن تدقيقه وقياسه. 


ولك يمكن لمستودع ما الحصول على هذه المتطلبات» أكدت 001.2 سمه 21:06 
(2002:13) أنه ينبغي أن يكون متوافقاً مع النموذج ال مرجعي لنظام المعلومات الأرشيفي 
المفتوح (2012 0005105)(-2طء]573 12101122102 امحتطاءتةث مصعم 0 15خ 0) وأن يمتلك 
ا مسؤولية الإدارية. والسلامة التنظيمية. والاستدامة امالية, واملائمة التقنية والإجرائية, 
وأمن النظامء والمساءلة الإجرائية. وتساعد كل هذه الخصائص معاً على ضمان وبناء الثقة 
في البيانات ومستودعها. 

وتعد البنية التحتية السيبرانية أكثر من مجرد مجموعة من المحفوظات الأرشيفية 
الموثوقة فهي شمكن من تبادل البيانات والتشارك في موارد البنية التحتية باهظة الثمن. 
وتتألف البنية التحتية السيبرانية من مجموعة متكاملة من المعدات المتخصصة والتقنيات 
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الشبكية (تشمل المراصد والمرافق البحثية التجريبية» وشبكات الاستشعارء وما إلى ذلك)» 
والخدمات والأدوات لبرمجيات التشغيل المتبادل والبرمجيات الوسيطة. والخدمات المشتركة 
(المتعلقة بإدارة البيانات ومعالجتها). وأدوات التحليل مثل التمثيل البصري للبيانات 
(غان ييل القالتطبيقات الرسوم البيائية ورسح العراقط): والسياسات المشتكة زقيها 
يتعلق بحق الوصول للبيانات واستخدامها وحقوق الملكية الفكرية» وغيرها) التي تمكن 
من نشر البيانات وتوزيعها. وربطها بعضها مع بعض وتحليلها (هيئة البنية التحتية 
السيبرانية 2007 011211) عتننااعنا]5ة121ء0776). كما تسعى إلى تعزيز تنمية ا مجتمع 
الثقافي الذي يدعم التعاون المباشر بين الأفراد متجاوزاً الحدود الجغرافية والمؤسسية 
(2007 اأعطناه0 عتداع دمصت ط07). وبينما تستخدم أجياناً لوصف البنية التحتية 
التي تمكن عمل مستودع بيانات موحدء فإنها تستخدم هنا للدلالة على البنية التحتية 


وبعبارة أخرىء هناك قواعد صارمة متعلقة بتطبيق المعايير على البيانات والالتزام بها داخل 
البنية التحتية. وتشمل مثل هذه البنى التحتية السيبرانية تلك التي تنفذها الوكالات 
الإحصائية الوطنية والبنى التحتية المكانية الوطنية للبيانات. إضافة إلى البنى التحتية 
العلمية واسعة النطاق التي تتعلق بأبحاث الجينات» وعلم الفلكء والأرصاد الجوية وغيرهاء 
والتي تتطلب تخزين كافة البيانات ومشاركتها مع الامتثال لمعايير محددة من أجل تحقيق 
أقصى قدر من قابلية التشغيل البيني للبيانات وضمان جودة البيانات» والإخلاص والنزاهة 
التي تعزز الثقة. وهذه الأخيرة لها أهمية خاصة في مجال العلوم: والسياسات التي تقوم 
غلى أساسها مثل تتبّع تغيرات المناخ وتنيؤاتة حيت تحن سلامة البيانات أمرا بالغ الأهمية 
في المناقشات الجارية حاليا. 

وإضافة إلى بوابات البيانات. والمستودعات. والبنى التحتية. تم استحداث عدد من 
ا منظمات والهياكل المؤسسية التي تقدم المشورة بشأن أفضل ا ممارسات في مجال الحفظ 
الرقمي: وإتاحة ومشاركة البيانات» والتحقق من صحة العمل وامعايير المتعلقة بالأنواع 
المختلفة من بنوك البيانات, والدفع باتجاه تنميتها وتطويرهاء وتنسيق الجهود المختلفة 
بشأن ذلك (انظر الجدول 2-3). وتؤدي هذه ال منظمات والهياكل المؤسسية عملها من خلال 
أنشطة عدة مثل تقديم البرامج التدريبية والتعليمية. واستضافة الندوات والمؤتمرات» وإنتاج 
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الكتيبات والأدلة» وتوفير التمويل اللازم لمبادرات محددة. وتكتسب هذه المنظمات أهمية 
نظراً لإمهاماتها في خلق مجتمعات الممارسة بين مختصي البيانات» وتسهيل المفاوضات بين 
الهيئات وتوسيع نطاق الجهود المؤسسية. ووضع مبادئ توجيهية ومعايير مشتركة. ويركز 
بقية هذا القسم على مستودعات البيانات البحثية والبنى التحتية» ويفضل في الأسس 
المنطقية لها والتحديات التي تواجههاء كما ستتم مناقشة البنى التحتية الخاصة والمتعلقة 
بشركات البيانات التجارية في وقت لاحق في هذا الفصل. 


جدول رقم (5-؟) 
أنواع وأمثلة البنى التحتية للبيانات 


حاوية البيانات 8هذل1101 22:2 | يُطلق على مجموعات غير رسمية من ملفات البيانات التي تكون على جهاز حاسب 
شخصيء ويسمى نظام النسخ الاحتياطي في بعض الأوقات. 


محفوظ البيانات أرشيك لوني لبيانات الصور (04آ1آ-ع"خطءغة 1022 ع15228 1.0111) هو أرشيف 
آمن لصور الجهاز العصبي والبيانات السريرية الطبية ذات الصلة بالمشاريح البحثية 


(أرشيف البيانات) 1028 1 : . 
في جميع أنحاء القارة الأمريكية الشمالية والقارة الأوروبية. 


عكتطء تلم 
أرشيف الموسيقى العايمية الموجود في مكتبة موسيقا لويب (1.065) في جامعة 
هارفارد الذي يقدّم تخزيناً آمناً ووصولاً متاحاً لمحتوى الأرشيف والتسجيلات 
التجارية الصوتية والمرئية للموسيقى من جميع أنحاء العام. 


الكتالوجات: الأدلّة, البوابات» | تمكن خدمة البيانات الوطنية الأمترالية المستخدمين من تصفح أكثر من أربعمائة ألف 
البيانات الوصفية, والمجمّعون | من مجموعات البيانات وأكثر من ثلائمائة ألف مشروع تقوم بإنشاء مجموعات البيانات. 


135م]ءع101 , وعناع 001210 | تتيح المكتبة الرقمية العامة الأمريكية الوصول إلى مليونين وخمسمائة ألف سجل من 
, 2116]20268 , 201015 , سجلات البيانات الوصفية من مكتبات. ومحفوظات. ومتاحف مقرها الولايات المتحدة. 


15 ا . 55 8 5 5 5-906 50090 
508 يوروبيانا هي بوابة إلكترونية ومجمع للبيانات الوصفية لأكثر من مئة وثلاثين من 


المكتبات والمتاحف وال مكتبات الرقمية للوسائط المتعددة في جميع أنحاء أوروبا. 
محفوظات بيانات ا مجلس الأوروبي للعلوم الاجتماعية (6855104©) هي 
بوابة إلكترونية ومجمع للبيانات الوصفية منذ ما يزيد عن ثلاث وعشرين سنة 
ممستودعات البيانات الأوروبية الإحصائية للعلوم الاجتماعية التي تضم أكثر من 
نمانية وعشرين ألف من مجموعات البيانات. 
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مستودعات بيانات الموقع خدمات أرشفة وشبكات البيانات (4715) هو الأرشيف الوطني الهولندي 
الواحد لبيانات البحوث الرقمية. إضافة للأرشفة, وتقدّم المبادئ التوجيهية للتدريب 
والاعتماد. 


15مع 2 عغازو-ء 51181 
أرشيف بيانات المملكة المتحدة (10124) هو مستودع بيانات الموقع الواحد 
لبيانات بحوث العلوم الاجتماعية والإنسانية الممولة من قبل مجلس البحوث 
الاقتصادية والاجتماعية (85110): ولجنة نظم المعلومات ال مشتركة (11500)» 
وجامعة إسيكس 855©2©0). 


مستودعات بيانات متعددة |المستودع الرقمي الآيرلندي (111) هو مستودع رقمي موثوق للبيانات 

المواقع امعاصرة والتاريخية» الاجتماعية والثقافية. وتقوم عليه المؤسسات الأيرلندية, 
ويوفر إتاحة الوصولء والحفاظ على البيانات للجهات المعنية ذات المصلحة 
واكتشافها. 


و م1 عزو 1/11 


أوبونير (©62811م0) هو مستودع رقمي متعدد المواقع للحصول على البيانات 
العلمية المفتوحة في منطقة البحث الأوروبية المكوّنة من واحد وأربعين منظمة 
وثلاثة وثلاثين بلدا أوروبيا. 


المكتبة الرقمية لتكساس (111) هي مجموعة من مؤسسات التعليم العالي 
التي توفر منصة وخدمات مشتكة لتوفير الوصول المفتوح للبيانات والحفاظ 


البنى التحتية السيبرانية | توفر البنية التحتية للبيانات الجغرافية المكانية الكندية (067[1©) 
الوصول الموحّدء والمتسقء والدقيق» والقابل للتشغيل المتبادل للبيانات 
امكانية عبر القطاعات والنطاقات الكندية. 


ع1 ص[ نع حار 





المصدر : مقتبس بتصرف من (2!.)2013 اء 11منتتهن'0. 
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جدول (”7-؟) 


مجموعة منتقاة من مؤسسات تقديم المشورة» والضغط لكسب التأيبدء والتنسيق للمحافظة على 
البيانات وإتاحتها للوصول والمشاركة وإعادة الاستخدام في العلوم الاجتماعية والإنسانية 


اتحاد جميع الأكادميات ات فين نوع م1110 [لخ 1ه دمتكغدمعلع8 ع1" 
الأوروبية ذظ[طاذ) وعنصدعلهعم) 


ا محفوظات الصوتية .ع152-117 ,1ر1 وعكنطءع تنخ لصتندهك وآ مصه أمظ 
البريطانية والايرلندية د15ة)) 


الاتحاد الأو روبي لمحفوظات 01 1111 ععمعك5 5021 وعم متا 01 متناتاره مده 


البيانات للعلوم الاجتماعية 1ش 10262 


التحالف من أجل معلومات ين 1[ن)) صم متم لععارمساعل؟ .10 سمنانلهمه) 


مترابطة 


موارد اللغة المشتركة والبنية ناء تمك اتلك 24 5عع50111ع15 121511286 012013201 
التحتية التقنية [1[شآت) عنتناأع1تتأمدهكم] برع ه[مصطاعع]1) 


لجنة البيانات للعلوم قن ععمعك5 101 غ102 جه عع ا تسصده 0 
والتقنية للمجلس الدولى 20221 طنعغص] عط ؤه توعه1[مصطاعع]' 
للعلوم ععمعك5 101 لفستاه 


الخدمات الرقمية للبنية التحتية .151 .111117 ه50 101 ع اناعم تاكة م1 وعع ع5 1هأنو انآ 
للعلوم الاجتماعية والإنسانية 1 وغ لمم صبط لصه وععمعكن5) 


1111 


الشراكة للإنتاج الرقمي 022آ1) متطةوتعصعمدط دمناعنله:ط لمغنتعندآ) 
«متحاة اع ساعد مدم تاعسل :مله زعتل 


ع1نآ.0» 
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الفصل الثاني 


الاتحاد الدولي ل محفوظات ريشق ده نستعاء1' 1ه سمتكتهمعلع2 لممم نه مس1 


التلفزيون 114 1خذ1ظ) وءحتطءمم) 


الرابطة الدولية لخدمات فنفيقن 5041 101 ممنكغدكوومة لهدم له صمعغم1 
امعلومات والتكنولوجيا 4 ذععاكاء5 112001مكس] ععمعكن5 
للعلوم الاجتماعية 151 4) عه 1مصطءع1) 


الرابطة الدولية 01 .ع253-11 111171171 4 501120 01 متامك وومة 26021 مع م1 
للمحفوظات الصوتية ونث 101151121لننق 
والسمعية - البصرية 


اتحاد الجامعات للبحوث /2». اع متنا توص وكوك 101 00250111112 لقاع كتداع م1 


السياسية والاجتماعية 1011251 خ251ل]) طءتوعوع8 1م50 لصه لدعنغناهط) 


شبكة الخبرة في التخزين | /ع0.ع تناع «خطءممالء تو صه اص طتاعا-عده.آ صذ عمتاتك وعد 1ه علتدمواء ل[ 
على المدى الطويل للموارد | 26ده1/1015/11م6وعص/وعغتوطن5/ | خ5185:101) وعء1ناموع1 011621[ 1ه عو12ه]5) 


الرقمية 


مؤسسة الكواكب ال مفتوحة | .51401120861052اع ةمصع مزه كوم 10 فاأعصةاط ممعم 0 


01 


المصدر : مقتبس بتصرف من 2013) .21 كه 1[مضهن'*0). 





الأسس المنطقية للبنى التحتية للبيانات البحثية: 

بالنظر إلى أن بناء البنى التحتية للبيانات هي ممارسة ليست باليسيرة» ومكلفة من حيث 
الموارد والوقت الذي يستلزمه إنشاؤها والمحافظة عليها بشكل مستمرء فينبغي أن تكون 
هناك أسباب معتبرة لإجراء مثل هذا المسعى والمضي فيه. ويستعرض الجدول (6-؟) قائمة 
لأكثر من ثلاثين من هذه الأسباب مقسمة على ثلاثة أبعاد - مباشرة / وغير مباشرة» وفي الملدى 
القريب / وعلى ال مدى البعيد. والعامة / والخاصة بحسب تعريف (2010) .21 أ عتتودء8. 
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ويمكن أن تترجم هذه الأسباب تقريبياً إلى المكاسب العلمية والمالية» والتأثير التراكمي للفوائد. 
والمستفيدين من هذه البنى التحتية. 

وتتمحور المناقشات والحجج العلمية لتخزين» ومشاركة: وتوسيع البيانات داخل البنى 
التحتية للبيانات حول وعود من الاكتشافات والابتكارات الجديدة من خلال الجمع بين 
مجموعات البيانات والتوظيف الجماعي للعقول المشاركة. فمجموعات البيانات الفردية 
ذات قيمة في حدّ ذاتها. ولكن عند ضمّها جنباً إلى جنب مع مجموعات بيانات أخرى 
أو تفحصّها بطرق وأساليب جديدة: فإن رؤى وأفكار جديدة من المحتمل أن تظهر 
وأسئلة جديدة من ال ممكن أن تتم الإجابة عليها (2007 تتهدمع:80): فبسبب الطبيعة 
التراكمية. من خلال الجمع بين مجموعات البيانات» يمكن الزعم بتسارع وتيرة بناء المعرفة 
(2007 .81 ]© 1113116ج.1). وعلاوة على ذلكء يصبح من الممكن من خلال الحفاظ على 
البيانات تتبع الاتجاهات والأنماط مع مرور الوقتء وكلما ازدادت فترة التسجيل للبيانات, 
زادت معها القدرة على بناء النماذج وأنظمة المحاكاة ومن ثم زيادة الثقة في الاستنتاجات 
التي يتم التوصل إليها (2007 .21 »© 1.211121116). لذاء فإنه ومع مرور الوقت. تزداد 
القيمة التراكمية ل مستودعات البيانات والبنى التحتية بحيث تصبح البيانات متاحة على 
نطاق واسع وبشكل أكثر يسرا وذلك من حيث النطاق والصلاحية الزمانية. 


ومن المرجح أن تعمل هذه المشاركة الاستراتيجية إلى بث روح التعاون بين الباحثين والفرق 
في التخصصات الجديدة: وتعزيز المهارات بصورة أكبر من خلال إمكانية الوصول إلى أنواع 
جديدة من البيانات (2007 2232ع8501). وعلاوة على ذلكء فإن تبادل ا معلومات واعتماد 
معايير وبروتوكولات وسياسات البنية التحتية من شأنه أن يرفع من مستوى جودة البيانات 
وأن يفسح المجال لأطراف أخرى لإنتاج بيانات مُشتقة والتحقق من البيانات المتاحة» ومن 
ثم زيادة سلامة البيانات (2007 .6621 14ناهة:ناه.آ). كما تعمل البنى التحتية أيضاً على 
إتاحة بيانات عالية الجودة في التعليم وتحسين المصادر التربوية والتعليمية لتدريب الجيل 
القادم من الباحثين. كما أن البنى التحتية للبيانات هي الوسيلة الوحيدة لإدارة البيانات 
وا لمشاريع بكفاءة وفعالية في الحالات التي تعتمد فيها المشاريع العلمية بشكل كبير على 
أدوات تقنية المعلومات والاتصالات الباهظة الثمنء والتي ينتج عنها كميات هائلة من 
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الفصل الثاني 


البيانات. وكذلك في المشاريع التي تضم فرقاً بأعداد كبيرة من الباحثين المنتشرين في جميع 
أنحاء العام لتحليل هذه البيانات: لذا فإن البنى التحتية للبيانات تُمثل الوسيلة الوحيدة 
الفاعلة والفعالة لإدارة مثل هذه النوعية من البيانات والمشاريع (2007 تهحمعه8). 


وتتمحور الفوائد المالية للبنى التحتية للبيانات حول الموازيين الاقتصادية التي تنشاً 
من خلال تقاسم الموارد ومشاركتها وتجنب تكرارهاء والآثار المترتبة على إعادة الاستخدام 
للبيانات المكلفة:. والثروة الناتجة من خلال الاكتشافات الجديدة, وإنتاج مجتمعات 
أكثر كفاءة. فالبحث عملية مكلفة في العادة. حيث تنفق وكالات التمويل المختلفة 
بشكل جماعي مليارات الدولارات سنوياً لتمويل النشاط البحثي» وينطوي جزء كبير من 
هذا النشاط على ازدواجية غير ضرورية في جهود إنتاج البيانات. ومعالجتهاء وإدارتهاء 
وتحليلها. وبدلاً من إنشاء عدد كبير من المحفوظات الأرشيفية الخاصة, فإنه من المنطقي 
إنشاء عدد أقل من البنى التحتية المخصصة التي تقوم بتقديم وتحضير البيانات الأساسية 
على صورة موحّدة, وتنتج فعالية كبيرة في الجهد. وتمكن كذلك وصولاً أوسع للبيانات 
للأفراد الباحثين والمؤسسات كون تكاليف الدخول إلى حقل أو مجال بحثي في العادة 
باهظة (2008 .21 © 1277). وإضافة إلى ذلك. ستصبح عمليات ونتائج المشاريع البحثية 
أكثر شفافية ويمكن الحكم على مدى تمثيلها القيمة مقابل المال. وفضلاً عن الحدّ من 
الهدر والحفاظ على الثمار الناتجة من هذه الجهود وتقاسمهاء فإنها ستعمل على تعظيم 
العائد من الاستثمار من خلال تمكين أكبر قدر من المكاسب التي يمكن الحصول عليها من 
البيانات (2007 .21 © 1:2111121116). فعلى سبيل امثالء قد ينتج عن إتاحة البيانات على 
نطاق واسع صناعات جديدة قائمة على المعرفة وتكون شركات منبثقة ومنفصلة من خلال 
تسويق البحوث ال ممولة من القطاع العام (ائتلاف العلوم 2013 <م16له00 ععمعك5), 
كما يمكن للبيانات ضمن البنى التحتية للبيانات أن تؤدي إلى طرق أكثر فعالية في الحوكمة 
والإدارة المجتمعية. على سبيل المثالء توفر العديد من البنى التحتية للبيانات المكانية 
الوطنية. إضافة إلى دعمها للبحوث المكانية, أدوات فعالة للإدارة والحكومة الإقليمية, 
وتمكن من الاستعداد للطوارئ والاستجابة للكوارث بصورة أكثر فعاليةء وثسهيل التخطيط 
بين الدول. 
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وبحسب ما تم إيضاحه من خلال النقاش حتى الآن» فإن الفوائد ا محتملة المكتسبة 
من البنى التحتية للبيانات هي فوائد ممتدة وغير محصورة بالقطاع العام أو الخاص 
(2010 .21 غ» عنمودء8). وقد ظهر جليا في الواقع أن استراتيجية مشاركة البيانات 
وتقاسمها تعود بالفائدة على جميع الأطراف - الباحثين» المؤسسات» الممولين» والمؤسسات 
العامة والخاصة. فعلى مدى العقدين الماضيينء وبالنظر إلى ال مكاسب المتوقعة من مشاركة 
البيانات وتبادلهاء عملت الوكالات البحثية للحكومات الوطنية والهيئات الإقليمية مثل 
الاتحاد الأوروبي» جنباً إلى جنب مع المنظمات الخيرية» على الاستثمار بنطاق واسع في تمويل 
مجموعة كبيرة من المبادرات المختلفة. ومع ذلكء وكما هو مبين أدناهء فهناك مقاومة ممثل 
هده ا لمشاريع. وعلى الأخص من قبل الباحثين أنفسهم. ومن الواضح أنه على الرغم من 
أن هناك فوائد لا شك فيهاء فهناك أيضا تكاليف مرتبطة بإنشاء البنى التحتية للبيانات. 


تحديات بناء البنى التحتية للبيانات: 
على الرغم من الفوائد المتوقعة والمُدركة من البنى التحتية للبيانات. إلا أنها م تلق 
ترحيبا عالمياء كما أنها أثبتت صعوبة بنائها وتنفيذهاء فهناك مجموعتين رئيسيتين من 
القضايا الفاعلة - التقنية والاجتماعية/ السياسية - التي تعوق تطوير البنى التحتية للبيانات 
وتنميتهاء وستواصل القيام بذلك لبعض الوقت. 
جدول رقم (6-؟) 


فوائد مستودعات البيانات والبنى التحتية للبيانات 


الفوائد المباشرة الفوائد غير المباشرة (تجنب التكاليف) 


التواصل العلمي / إتاحة الوصول إلى البيانات. عدم فقدان لفرص البحث المستقبلية. 


إعادة تحديد الأهداف وإعادة استخدام البيانات. | انخفاض تكاليف المحافظة على البيانات في المستقبل. 


زيادة الإنتاجية البحثية إعادة توظيف البيانات للمهتمين الجدد. 
تحفيز أنواع جديدة من التواصل / التعاون. إعادة توظيف المنهجيات المستخدمة. 


إتاحة البيانات للتعليم ومشاريع الطلاب. الاستخدام من قبل مهتمين جدد. 
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الفصل الثاني 


ساي اال عل امار ليك 


تحسين قاعدة المهارات. الأدوات وال معايير يحتمل أن تزيد من مستوى جودة 
البيانات. 


زيادة الإنتاجية / النمو الاقتصادي. تقليل الاستفسارات العشوائية المتعلقة بالبيانات 


التثبت من البحث / سلامة البحث 


سم ا | 00 


قيمة للباحث والطلاب الحاليين. تأمين القيمة للباحثين والطلاب المستقبليين. 


وتطورها للحد الأقصى. 


توسيع إتاحة الوصول حيث التكاليف الباهظة | زيادة سرعة البحث والوقت اللازم لإدراك آثاره. 
للباحثين / المؤسسات. 


إعادة الاستخدام على المدى القصير للبيانات المنسقة | يحفز الأسئلة البحثية الجديدة: وبخاصة المتعلقة 
1 بالبيانات المرتبطة والمشتقة. 


تعزيز توافر البيانات للنشر والمشاركة. 


الفوائد الخاصة الفوائد العامة 


فوائد للرعاة / ا ممولين من البحث / المحفوظات. 


فوائد للباحثين والمؤسسات. تحفيز البحوث الجديدة. 
الوفاء بالالتزامات الخاصة باطنح. تحفيز الشركات الجديدة وتوظيف اطهارات العالية. 


زيادة الوضوح / الاقتباس. الشفافية في مويل البحوث. 





الاتجار بالبحوث 


المصدر: 2008 21 غء 8296 :2010 .21 ء عتتعدء8. 
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إن الشبادينية شهية عاملة وقابلة التشغيل الالال للبيانات لبس قعذيا هيا خاضة 

إذا كان النظام مفقدقا ويقدم مستويات مختلفة من إتاحة الوصول اعتماداً على تعريف 

المستخدم وضمانات فيما يتعلق بمصدر البيانات وسلامتهاء ونزاهتهاء وصلاحيتها. فذلك 

يتطلب تعاوناً مكثّفاً وواسع النطاق والموائمة بين منتجي البيانات ومالي المحفوظات 
الأرشيفية فيما يتعلق بالتالي: 


٠‏ إجراءات إنتاج البيانات. 
٠‏ نماذج البيانات ومعايير البيانات. 
« البيانات الوصفية والتوثيق. 
« إجراءات تحضير وتنقية وإدخال البيانات. 
ه جودة البيانات وضمانها. 
٠‏ سياسيات الحفاظ على البيانات» والنسخ الاحتياطيء والتدقيق عليها. 
٠‏ البرمجيات وال معدات. 
« أمن وحماية المعلومات. 
٠‏ سياسات الوصولء ومنح التراخيصء والاستخدام: وإعادة الاستخدام, والخصوصية, 
والجوانب الأخلاقية. 
ه سياسة الملكية. وحقوق الطبع والنشرء وحقوق الملكية الفكرية. 
٠‏ الترتيبات الإدارية وآليات تنظيم الإدارة والحوكمة. 
٠‏ تمويل البنية التحتية وخدماتها وإدارتها. 
(2012 ططع18 همه اامضد0”0 :2010 101مناممة 2ه 1دء5 120:2 :2007 صممحموءه8) 
فالبنية التحتية للبيانات لن تنجح إلا إذا كان لديها رؤية طويلة الأجلء وهناك التزام 
لإدارة المحتوى نيابة عن المودعين والمستخدمين وتحمل مسؤوليتهاء مع التطبيق التام 
لجميع العوامل المذكورة أعلاه بشكل فعال (2012 ططع11 لصة 1[مضهن”0). 
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فالقضايا التي تمت الإشارة إليها ليست مجرد قضايا تقنية, ولكنها أيضاً اجتماعية وسياسية, 
ذلك لأنها تتطلب التفاوض والاتفاق على طريقة تصميمها واختيارها ومتطلبات إدارتها 
القائمة بين العديد من الأطراف - الممولينء والمصممينء والمبدعينء وامديرين والمودعين» 
ومجموعات الضغط والتوجيه؛ والمساهمين وأصحاب المصالح الخاصة الأخرى - في سياق 
مختلف التعليمات, واللوائح» والقوانين المتعلقة بإنتاج» وتخزينء ومشاركة البيانات. ومن 
ثمء فهي تتشكل بواسطة الأجندات الشخصية والشخصيات. والقيم المؤسسية» والالتزامات 
والوصايات,. والثقافات. والهياكلء والعمليات, والتمويلء والقضايا الحكومية: والتبعيات 
الإجرائية حيث أنه بمجرد أن يبدأ المشروع في مسار معينء فسيكون من الصعب غالباً توجيهه 
في مسار مختلف كلياً عنه (2007 .21 أت غ211112111آ :2012 ا[تته تاهآ سذئناء طمعع]) . 
كما يمكن أن يكون تجميع ومواءمة ا محفوظات الأرشيفية المعتمدة على مسارات تقنية 
مختلفة عملية في غاية الصعوبة: وطويلة الأمد. ومكلفة لأنها تتطلب من تلك المشاريع 
إجراء تغييرات لتحديث بياناتها المتقادمة لتتوافق مع ال مواصفات المتفق عليها في الموائمة 
(121142012ناج,1). وهذا هو السبب في اعتماد العديد من اللمشاريع الأرشيفية على بنية 
مستودع البيانات بدلاً من السعي لتصبح بنية تحتية إلكترونية/ سيبرانية. 

ويأقٍ بعد الصعوبات المتعلقة بإنشاء هياكل تبادل البيانات: إقناع أصحاب البيانات 
أنفسهم بتبادل سلعتهم الثمينة (بياناتهم)» فهناك مبدأ أساسي في البحوث الأكادمية وهو 
إتاحة الوصول المفتوح؛ بمعنىء أن جميع جوانب إنتاج المعرفة ينبغي أن تكون متاحة بحرية 
للآخرين لتفحصها ونقدها. وهذا المبدأ لم يُعمل به على النحو الأمثل أبداً إذ تختفي الأبحاث 
الأكادمية في الغالب خلف حواجز الأجور ويتردد الباحثون في مشاركة بياناتهم وتبدلها مع 
الآخرين. وكما أشار (2007) تهدمع:80, فإن مشاركة البيانات وتبادلها شائع في عدد قليل 
من التخصصات مثل علم الفلك (03377متتامش). علم الجينات (12125ممء0), وعلم البيانات 
العمرانية بهيئتها الرقمية (760123615) والتي تعتمد على فرق علمية كبيرة وموزعة جغرافيا؛ 
أما في التخصصات الأخرى فيجري في أحيان نادرة مشاركة البيانات وقد لا تجري على الإطلاق. 
وقد خلصت 2هدمع501 إلى أن «السرٌ الصغير القذر» وراء تشجيع مشاركة البيانات. وتبادلها 
هو عدم التبادل لكثير من البيانات في الواقع (1059 :2012 تهدمعده8). وذلك لأن هناك 
عددا من المثبطات التي تحول دون تبادل البيانات ومنها: 
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« الجهد اللازم لإعداد وأرشفة البيانات. 
٠‏ نقص الخبرة واموارد والأدوات اللازمة لأرشفة البيانات. 
٠‏ مخاوف من القدرة على استخراج قيمة من البيانات قبل الغير. وذلك من حيث الأوراق 
العلمية وبراءات الاختراع» ونظرا للجهد المستثمر في إنتاج البيانات. 
٠‏ المخاوف بشأن الكيفية التي سيتم بها استخدام البيانات. خاصة إذا كانت تتعلق 
بأشخاصء أو كيف ممكن أن يساء التعامل معها أو يساء تفسيرها. 
٠‏ المخاوف بشأن الاستفسارات بخصوص إنتاج البيانات والطلبات التي من شأنها أن 
تستلزم أعمالا إضافية. 
٠‏ مخاوف من القضايا المتعلقة بالكشف عن البيانات ونتائج البحوث التي يمكن تقويضها 
من خلال تفسيرات بديلة لنفس البيانات. 
« قضايا الملكية الفكرية. 
٠‏ الخوف أنه لن يتم استخدام البيانات: وبالتالي تشكل الأرشفة جهداً ضائعا. 
(2013 تاء5]255 :2012 ,2007 تهحصوحهظ ). 
فمن الواضح أن ضمان البيانات من خلال أرشفتها لإعادة استخدامها مستقبلاً سوف 
يتطلب أكثر من محرد إنشاء مستودعات البيانات والبنى التحتية لها؛ كون ذلك يتطلب 
تشييرا ثقافياً في الممارسات البحثية. ويتكشف هذ التغيير للعيان باستخدام إستراتيجية 
العصا والجزرة. فمن ناحية بدأ استخدام الحوافز لتشجيع الباحثين على أيداع وتبادل 
البيانات» مثل تشجيع الاقتباس والإسناد عند إعادة استخدام البيانات (2012 مهدع:ه80)» 
وتوفير الأموال الكافية لأرشفة البيانات ضمن جوائز المنح. ومن ناحية أخرىء بدأت وكالات 
الأبحاث في إجبار الباحثين على إيداع وتبادل البيانات, مع مراعاة الجوانب الأخلاقية وحقوق 
املكية الفكرية.ء كشرط لتمويل البحوث. 
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وسطاء البيانات والأسواق (5اع21221 لصه 25ع82012 12262): 

يمتلك القطاع الخاص دافعاً مختلفاً جداً لإنتاج وإعادة استخدام البيانات عن ذلك الذي 
عند الأكاديميينء فالبنى التحتية للبيانات البحثية تسعى لتحقيق الصالح العام من خلال 
إنشاء مشاعات للبيانات لتسهيل وتشجيع تبادل البيانات وإعادة استخدامها. وفي المقابل» 
يلتقط وسطء البيانات (يسمون أحياناً مجمعي أو مختزلي أو بائعي البيانات) البيانات 
ويجمعونها معاً ويعيدون تعبئتها (تحزيمها) في البنى التحتية للبيانات التي يملكها القطاع 
الخاص لعرضها للإيجار (للاستخدام لمرة واحدة أو لاستخدامها تحت شروط الترخيص) 
أو إعادة البيع على أسس ربحية. وتشمل المنتجات قوائم العملاء/الزبائن ا محتملين 
الذين يستوفون معايير معينة (مما في ذلك تفاصيل مثل الأسماءء العناوين» أرقام الهاتف. 
وعناوين البريد الإلكتروني» وكذلك معلومات مثل «الجنسء العمرء العرق» وجود الأطفال. 
الدخلء قيمة المنزل: ملكية بطاقة الائتمانء الوضع الائثتمانيء أنماط الشراءء والهوايات»؛ 
(1 :2006 012210). والتدقيق على الخلفية الأمنية. ومجموعة من منتجات البيانات 
المشتقة التي أضاف لها الوسطاء قيمة من خلال التكاملء ومنتجات تحليل البيانات 
التي تستخدم في معظم الأحوال لحملات الدعاية والتسويق المصغرة» وتقييم الجدارة 
الائتمانية والتصنيف الاجتماعي للأفرادء وتوفير خدمات البحث عن المفقودينء وتقديم 
تحليلات الأعمال ال مفصّلة (2006 0157810). وفي حالة القوائم» فهي في معظمها مستأجرة 
وفي كثير من الحالات لا يستلم المستأجر القائمة. حيث يعمل مكتب خدمة كطرف ثالث 
على إعداد وإرسال البريد بالنيابة عنهم (2006 012810). وبالمثلء مع تحليلات البيانات» 
حيث يتلقى العملاء نتائج تحليل البيانات. وليس ذات البيانات الأساسية. 

إن عمليات اختزال البيانات وإعادة بيعهاء وما يرتبط بها من تحليل للبيانات وخدمات 
ذات قيمة مضافة, هي صناعة بمليارات الدولارات» مع كميات هائلة من البيانات والمعلومات 
ا مستمدة التي تؤجرء وتباع» وتشتري بشكل يومي عبر مجموعة متنوعة من الأسواق - تجارة 
التجزئة: والمالية» والصحة. والسياحة,. والخدمات اللوجستية: والأعمال الذكية, والعقارات, 
والأمن الخاص, والاقتراع السياسيء وإلى آخره. وتتعلق هذه البيانات بجميع جوانب الحياة 
اليومية وتشمل الإدارة العامة» والاتصالات. واستهلاك السلع ووسائل الإعلام» والسفرء 
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والترفيه: والجريمة. وتفاعلات وسائل التواصل الاجتماعية» وإلى آخره. فوس طاء البيانات 
ا متخصصين هم متواجدون منذ فترة طويلة. يجمعون البيانات من اشتراكات وسائل الإعلام 
(على سبيل المثالء الصحفء والمجلات)» وتجار التجزئة عبر طلبات البريدء واستطلاعات الرأي» 
والدراسات الاستقصائية. ووكالات السفرء والمؤتمرات. وا مسابقات. وتسجيلات وضمانات 
امنتجات» وشركات معالجة الدفع والسداد. والسجلات الحكومية. وإلى آخره (012510© 
6). وفي السنوات الأخيرة وخاصة منذ ظهور الإنترنت. توسعت هذه الصناعة بشكل 
سريعء مع التنوع في البيانات التي تم التقاطها واختزالهاء والمنتجات والخدمات التي تقدمهاء 
وغاليا ما تجمع معا على حَدٌ سواء البيافاك الصغية والكيرة. 

فبيع النيافاث للوسظاء أضيح يثل تدققا مهما للدخل للعدين هن الشركات, فعاى سبيل 
ا لمثالء يبيع تجار التجزئة» في كثير من الأحيانء البيانات المتعلقة بالعمليات مثل تفاصيل 
بطاقة الائتمان. ومشتريات العملاء وبرامج الولاء الخاصة بالمتجرء وإدارة علاقات العملاء 
ومعلومات الاشتراك. كما تبيع المواقع الإلكترونية بيانات النقر (الاختيارات) المتعلقة 
بكيفية تصفح شخص ما بلوقع على شبكة الإنترنت والوقت الذي يقضيه على مختلف 
الصفحات. وبالمثل تستخلص شركات وسائط الإعلام, مثل محطات الصحف والإذاعة 
والتلفزيونء البيانات الواردة في محتواها (على سبيل المثال. الأخبار, والإعلانات). وتستخلص 
شركات وسائط التواصل الاجتماعي البيانات الوصفية وبيانات المحتوى لمستخدميهاء 
وتستخدم هذه البيانات لتحديد المواصفات الأساسية للمستخدمين ومنتجات البيانات 
الخاصة بهم: أو بيع البيانات لوسطاء البيانات. على سبيل المثال» تستخدم شركة فيسبوك 
ا ملفات التعريفية للمليارات من مستخدميهاء وشبكاتهم الاجتماعية. وا لمحتوى الذي 
يقومون بتحميله (المفضلات,. والتعليقات, والصورء والفيديوهات,. وما إلى ذلك) لتمكين 
مجموعة من المنتجات الإعلانية مثل الإعلانات الموجهة للجماهير المتماثلة (©>1نل01ه.1آ 
225 6 ). والجماهير المخصصة المدارة (5ع©2ع1016الى ددهؤ5نا 0ع3]3238). وفئات 
الشريك (801165ع026) “اعم29:6) وذلك بالشراكة مع وسطاء البيانات الكبيرة والمسوقين 
مثل داتا لوجيكس (2<ذع1026210): وأبسيلون (دملزوم8). وأكسيوم (دممنهعظ)ء وبلو كاي 
(نهكآعساظ) من أجل دمج بيانات الشراء الخاصة بهم التي لا تخص فيسبوك مع البيانات 
السلوكية التي يوفرها الفيسبوك (2013 80508105). 
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فبطرق مختلفة» يتخلى الأفراد عن البيانات الشخصية الخاصة بهم عن قصد أوعن غير 
قصد. وبدرجات متفاوتة: بصفة مشترينء أو مشتركينء أو مسجلينء أو أعضاء. أو حاملي 
بطاقاتء أو مانحين: أو متسابقين: أو مشاركين في الاستطلاعات: أو حتى مجرد مستفسرين 
(نذ :2006 012210). وعلاوة على ذلك. وحيث إن إنشاء. وإدارة» وتحليل البيانات هي 
مهمة متخصصة. تستعين العديد من الشركات بجهات خارجية من شركات معالجة البيانات 
وتحليلاتها للوفاء بمتطلبات البيانات الخاصة بها. وتستطيع هذه الشركات. من خلال 
تقديم هذا النوع من خدمات البيانات بمختلف العملاء» بناء مجموعات بيانات واسعة 
النطاق» والتي يمكن الجمع بينها وحزمها لاستخدامها في إنتاج بيانات مشتقة جديدة: والتي 
بدورها توفر المزيد من الأفكار والرؤى مقارنة بتلك التي يمكن تحصيلها من مصدر واحد 
فقط للبيانات. وإضافة إلى هذه البيانات التي يحصل عليها وسطهء البيانات من القطاع 
الخاص؛ يعمل هؤلاء الوسطاء كذلك على الحصول على مجاميع بيانات القطاع العام سواء 
التي تتعلق بالأفراد أو تلك التي تخص مجموعة منهم كفئة معينة وأماكنهم مثل بيانات 
سجلات الملكية والتعداد السكاني» كما يقومون باستئجار/ أو شراء القوائم المتعلقة بالأفراد 
من الجمعيات الخيرية والمنظمات غير الحكومية. 

ومن خلال تجميع البيانات من مصادر متنوعة. يُنشئ وسطء البيانات بنية تحتية من 
البيانات الضخمة واطترابطة. فعلى سبيل امثال. تشتهر شركة إبسيلون (51102م8) بامتلاك 
بيانات عن ثلائمائة مليون بطاقة ولاء من أعضائها في جميع أنحاء العام, إضافة إلى بنك 
معلومات يضم بيانات ذات صلة بممئتين وخمسين مليون مستهلك في الولايات المتحدة 
وحدها (2013 5017:05). كما تشتهر شركة أكسيوم (8100) بإنشائها بنكاً للمعلومات 
يتعلق بخمسمائة مليون مستهلك فال في جميع أنحاء العام (ثقريباً مئة وتسعون مليون 
شخص. ومئة وستة وعشرون مليون أسرة في الولايات المتحدة). مع نحو ألف وخمسمائة 
معلومة عن كل شخصء وتنفذ خوادمها أكثر من خمسين تريليون عملية في السنة. وتجاوز 
إجمالي تدوير رأس امال للشركة المليار دولار (20122 عع م1ذ5). كما تقير ايها قواعد 
بيانات منفصلة: أو تعمل مع سبعة وأربعين شركة من كبرى الشركات امئة الأكبر في العام 
(2012 ععصذ5). وتزعم شركة داتا لوجيكس (10221081) بتخزينها بيانات متعلقة 
بمشتريات م تتم عن طريق الإنترنت تبلغ قيمتها أكثر من تريليون دولار (2013 05قه8270). 


11 ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة, والبنى التحتية للبيانات» والنتائج المترتبة عنها 


البيانات الصغيرة» والبنى التحتية للبيانات» ووسطاء البيانات 


وتشمل شركات الوساطة والتحليل للبيانات شركات أخرى مثل شركة ألايانس داتا سيستمز 
(25اء]5775 10262 ععطد نالف )؛: وإي بيرو (تتهع#تاظء). وتشويس بوينت (غطذه2ءع1مطان)» 
وكورلوجيك كأفع00610)). وإيكيوفاكس (11452و8), وإكسبيريان (صهتمءم<:8): آي دي 
أنالاتكس (5ء76إ[1هصى 11): وإنفوجروب (م104082011): وإننوفيس (1220715)» وإنتليوس 
(1115أاءغ12), وريكورديد فيوتشر (1136111 01060ءع11): وسيسنت (5615126), وترانز يونيون 
(15825172102). وتتجه كل شركة من هذه الشركات إلى التخصص في أنواع مختلفة من 
البيانات ومنتجات البيانات والخدمات» فعلى سبيل امثال» تقيم شركة إي بيرو العملاء 
المحتملين بالنيابة عن شركات بطاقات الاثتمان» والمقرضينء وشركات التأمين: والمؤسسات 
التعليميةء كما تقدم شركة إنتليوس خدمات البحث عن الأشخاص والتحري عن خلفياتهم 
(20122 تتععطناد). 


وبشكل عام, فإن مبتغى وسطء البيانات وشركات التحليل هو مجموعة واسعة من 
البيانات (الصغيرة والكبيرة): والمتعلقة بأكبر شريحة ممكنة من السكانء وأن تكون هذه 
البيانات مترابطة بشكل كبير ويمكن تمييزها (تحوي تعريف فريد) بحسب طبيعتهاء وكلما 
ابغطاغ وسيظ البياقات تصدير ودمج المزيك من البيانات, كان عمل متععانه أكثر فجاعاً 
وعلى النحو الأمثلء واكتسب ميزة تنافسية عن منافسيه الآخرين. ويمكن من خلال جمع 
البيانات معا وهيكلتها بشكل مناسب لوسطهء البيانات اشتقاق بيانات جديدة. وملفات 
تعريفية عن الأفراد والمناطق» والقيام بإجراء النمذجة التنبؤية لتوقع ما قد يفعله الأفراد 
في ظل ظروف مختلفة وفي أماكن مختلفة. وهذا من شأنه أن يمكن من تحديد المستهدفين 
والمخاطر بشكل أكثر فاعلية بين مختلف المستهلكين وأن يُعطي مؤشراً على مدى التصرف 
ا محتمل لهؤلاء المستهدفين والدفع بهم لاختيار استجابة معينة (على سبيل المثال» اختيار 
وشراء عنصر معين). فشركة أكسيوم تسعيء على سبيل المثال» لربط البيانات غير المتوافرة 
على الإنترنت (10262 0111126).: والبيانات المتوافرة على الإنترنت (10262 ع5ذآم0): وحتى 
البيانات المتنقلة (122:2 240116) من أجل تكوين نظرة شاملة متعددة الزوايا عن 
المستهلكينء حيث تستخدم هذه البيانات لإنشاء ملفات تعريفية مفصلة وتماذج تنبؤية 
متماسكة (20128 510861). فهذه المعلومات والنماذج مفيدة جدا لشركات الشراء لأنها 
تمكنهم من تركيز جهودهم المتعلقة بالتسويق والمبيعات» وتزيد من فرص نجاح عملياتهم» 
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في ذات الوقت الذي تمكنهم من الحدّ من النفقات من حيث الهدر والخسارة التي قد تنتج 
عن استثمارات محفوفة بالمخاطرء ومن ثم تسعى هذه الشركات لتصبح أكثر فعالية وكفاءة 
في عملياتها باستخدامها بلثل هذه المنتجات. 

ومن امثير للاهتمامء أنه بالرغم من امتلاك وسطء البيانات وشركات التحليل لكميات 
كبيرة ومتنوعة من البيانات الشخصية التي تستخدم منتجاتها لتصنيف واستهداف الأفراد 
والأسر اجتماعياء فقد كان هناك نقص ملحوظ في الدفع بالاهتمام النقدي لعمليات هذه 
الشركات. ففي الواقع, هنالك ندرة في التحليل الأكادممي والإعلامي عن هذه الشركات 
والآثار المترتبة على عملها ومنتجاتهاء ويعود السبب في ذلك جزئياً إلى أن هذه الصناعة 
بعيدة عن الأضواء وسرية نسبياً ولا ترغب في توجيه انتباه الجمهور إليهاء وزعزعة ثقة 
الجمهور في أصولها وأنشصطتهاء والتي قد تؤدي إلى حملات عامة للشفافية: والمساءلة, 
والتنظيم. فوسطء البيانات بشكل عام غير منظمين إلى حدٌ كبير في الوقت الحاضرء كما 
أنهم غير ملزمين قانونياً بتزويد الأفراد بإمكانية الوصول إلى البيانات المحفوظة عنهم: ولا 
هم ملزمون بتصحيح الأخطاء المتعلقة بهؤلاء الأفراد (20126 1#ءع8هذ5). وإضافة إلى أن 
بيانات ومنتجات هذه الشركات يمكن أن يكون لها تأثير عميق في الخدمات والفرص اللقدمة 
للأفراد. مثل ما إذا كان سيتم تقديم عرض لفرصة عملء أو قبول تقديم طلب قرضء أو 
إصدار بوليصة تأمينء أو الموافقة على الاستئجار. وتكلفة السلع والخدمات المقدّرة على 
أساس ال مخاطر المتوقعة والقيمة بالنسبة لشركة ما (2002 <م17آ). 

إن قلق البعضء بمن فيهم 3) ع1 هآ طغ801) رئيسة لجنة التجارة الاتحادية 
(155102مصصطهن ع1820' لدعلع8) في الولايات المتحدة, يتمثل في ممارسة هذه الشركات 
شكلاً من أشكال حتمية البيانات (<ذونصندمء]»17 10262) التي لا يجري فيها فقط تصنيف 
الأفراد والحكم عليهم على أساس ما فعلوه, ولكن على التنبؤ بما قد يفعلونه في المستقبل 
باستخدام خوارزميات هي أبعد ما تكون عن الصحة والكمالء بحيث قد تحمل في ثناياها 
تحيزات تتعلق بالعرقء والإثنية» والجنسء والحياة الجنسية. وحتى الآنء فهم صناديق 
سوداء تفتقر إلى الرقابة المجدية والإجراءات المعالجة. وتستخدم بيانات منخفضة الجودة 
على الأغلب. ومن ثم تكون عرضة للخطأ (انظر أيضاً للفصل العاشر). وعلاوة على ذلك 
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فإن هذه الشركات تستخدم البيانات لغير الأغراض التي تم إنشاؤها لأجلهاء وبالتأكيد 
ليست لأغراض أولئك الذين تشير البيانات إليهم وتمثل ما قد يرغبون فيه فالذين يتقدمون 
ببياناتهم للحصول على بطاقة ولاء المتجر لا يتوقعون بالضرورة أن يتم بيع بياناتهم 
واستخدامها لأغراض تتجاوز علاقتهم مع المتجرء ولا يتوقعون استخدامها بطرق قد تعرضهم 
للعقاب والمحاسبة بعد ذلك (2013 12ج 18). وبينما يرحب بعض المستهلكين بالعروض 
الشخصية من امتاجر أو الإعلانات الموجّهة على المواقع الإلكترونية» يعدها البعض الآخر 
تطفلا واستغلالية (20122 7ء5128). وعلاوة على ذلك. فإن كنز البيانات التي قد يكون 
لها قيمة في المستقبل كإجراء للمضاربة السوقية: هو انتهاك لقوانين الحدّ من البيانات التي 
تنص على وجوب الإبقاء على البيانات محددة القيمة فقط (2013 (1031). ويعد وسطاء 
البياناة هدقا رقميا لالمعرمن العازمين هان اللميال ويرقة الهديات وذلك باليظر إلى 
حجم السجلات الشخصية الحساسة مثل الأسماء. والعناوين: وأرقام الهوية (مثل الضمان 
الاجتماعي. وجواز السفرء ورخصة القيادة). وأرقام بطاقات الائتمان المتوافرة لديهم. وفي 
الواقع. فقد تابعت لجنة التجارة الاتحادية (1:10 -مو1وةأستمطده0 1206 لدمعلع8) أكثر 
من أربعين قضية لخروقات أمنية خطيرة للبيانات. أغلبها ضد وسطهء البيانات, لفشلهم في 
توفير ضمانات أمنية كافية على البيانات (2013 2ع ننه 1). 

وفي الآونة الأخيرة» وفي أعقاب الخروقات الأمنية والكشف عن صفقات بيع مشبوهة 
واستخدام لبيانات حساسة (2013 هفءلوه1): جنباً إلى جنب مع الكشف عن برنامج 
بريزم التجسسي لوكالة الأمن القومي (210151/1 7154) ووصول الحكومة إلى سجلات تجارية 
(2013 11فكاوحعد]3 لصه 2104نكدءء:).: إضافة للأخبار عن فضيحة قرصنة الهاتف العالممي 
واستجواب ليفينسون (502ع1.6©7آ) في المملكة المتحدة (:17 أنهو تنحاهدوء؟00707.16ا/ /نصاغطا 
عآنا.018): فقد انصبٌ امزيد من الاهتمام على وسطاء البيانات وممارساتهم التجارية. ففي 
أواخر عام 2012, استدعت لجنة التجارة الاتحادية تسعة من وسطاء البيانات لاكتشاف 
المزيد حول ماهية البيانات والمعلومات الممستمدة منها التي يقومون بإنتاجها وجمعها عن 
الناس وكيفية توظيفهم هذه البيانات وطرق بيعهاء وأصدرت ودرا يدعو للخصوصية 
عند التصميم (انظر الفصل العاشر). وخيارات مبسطة. وقدر أكبر من الشفافية (لجنة 
التحارة الاتحادية 2012 55102تتصحدهن ع1520' 1دمعلع8). وعلاوة على ذلكء. فقد تم 
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تطبيق الضغط السياسي لاعتماد أنظمة أشدٌ رقابة وأكثر شفافية. أما في أوروبا فيسعى 
قانون الاتحاد الأوروبي الجديد لحماية البيانات لتنظيم كيفية استخدام البيانات» ومنح 
المواطنين الحق في الوصول إلى البيانات والتنازع عليها والحق في تناسيها وحذفها (انظر 
الفصل العاشر). وسيعتمد مدى نجاح مثل هذه الأعمال على إعادة تشكيل أعمال وسطاء 
البيانات والذي سيحدثنا عنه الزمن لاحقاء وفي غضون ذلكء هناك العديد من الأسئلة 
المتعلقة بوسطاء البيانات والأسواق وآثارها على المواطنين والمستهلكين التي تحتاج إلى 
استكشاف للإجابة عنها (انظر الفصل السادس). 


الخلاصة: 

على الرغم من الدعوات المنمقة لمؤيدي البيانات الكبيرة وأولويات التمويل للوكالات 
البعكبة: فإن النياناة السغيرة متمهكمر : بالقاء بافتبارها عنصرا عيوها في فضاء البحث 
العلميء فدراسات البيانات الصغيرة قد تكون محدودة في الحجمء. ومحصورة من حيث 
عيناتها وتنوعهاء وثابتة. وغير مرنة بمجرد تنفيذهاء ولكنها خدمت العلوم بشكل جيد حتى 
وقتنا الحاضر لأنها مصممة خصيصاً للرد على أسئلة مركزة بإحكام. ويُتيح إنتاج البيانات 
الصغيرة, جنبا إلى جنبء مع أدوات التحليل الجيدة, للباحثين التنقيب الدقيق وبشكل فعَال 
في مستويات محكمة من البيانات العالية الجودة من أجل فهم العام. وفي المقابل, وكما 
نوقش في الفصل الثامنء تسعى العديد من دراسات البيانات الكبيرة إلى الإجابة عن الأسئلة 
التي يمكن الإجابة عنها من البيانات المنتجة؛ فكما قيل: الذيل الآن هو الذي يهز الكلب. 

ومع ذلكء فمن الواضح أن رؤى وقيمة أكبر بكثير يمكن الحصول عليها من البيانات 
الصغيرة من خلال توسيع نطاقها في البنى التحتية للبيانات والاحتفاظ بها للأجيال القادمة. 
وفي حين أن البيانات ولفترات طويلة قد جُمعت معاء وجرى تخزينها وأرشفتهاء إلا أن 
تطور التقنيات الرقمية قد غيّر بشكل جذري قدرتنا على إدارة» وتنظيم» ومعالجة؛ وتحليل,» 
ومشاركة, وإعادة استخدام البيانات» وخاصة تلك البيانات التي ولدت رقمية في الأصل, 
فقد كانت البيانات الصغيرة فيما سبق نادرة ومقيّدة, ولكنها غدت متوافرة بشكل أكبر 
وأكثر انفتاحاً (انظر الفصل الثالث). وبتوسيع نطاق هذه البيانات يمكن تحقيق جدوى 
اقتصادية وذلك فيما يتعلق بخدمات البيانات. وأدوات التحليل واموارد التربويةء وتوظيف 
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البيانات في استخدامات جديدة: وإنتاج اكتشافات جديدة. ونتيجة لذلك. يُبذل الآن جهد 
كبير لإنتاج البنى التحتية للبيانات في جميع المجالات الأكاديممية. وهو الجهد الذي من شأنه 
أن يُتيح بشكل أكبر بكثير البيانات للمجتمعات المعنية وأن يُغيّر طبيعة عمل العلوم (انظر 
الفصل الثامن). 

ويتضح ا مدى الذي يمكن من خلاله لهذا التوسع إنتاج قيمة من خلال النمو السريع 
لقطاعي وساطة البيانات والتحليلات المصاحبة لها. حيث يمكن لوسطء البيانات. من خلال 
الجمع بين مخازن كبيرة من البيانات الصغيرة التي تحتفظ بها المؤسسات العامة والشركات 
الخاصة وذمجها جنبا إلى جنب مخ مجالات تدفق: الببانات الكبيرة إنتام مختلف أنواغ 
ا ملفات التعريفية التفصيلية للأفراد والمجموعات والتي يمكن استخدامها للاستهداف المركز 
للأسواق» وتقييمهاء وفرزهاء مما يوفر معلومات ذات قيمة عالية للعملاء. كما تكشف هذه 
ا ممارسات عن بعض القضايا والمخاطر الناجمة عن التوسع في نطاق البيانات» وبالتحديد 
استخدامها لغير الأغراض التي جمعت لأجلهاء وأمنها. والفرص الجنائية في حال تم سرقة 
البيانات. حيث م يُفهم أي من هذه القضايا والمخاطر بشكل تام حتى الآن» مع ضعف 
الجانب التنظيمي والإجراءات المضادة. 

فهناك العشرات من الأسئلة التي تتطلب اهتماماً بشأن الدور المستقبلي وطبيعة 
دراسات البيانات الصغيرة. وتوسيع نطاق البيانات الصغيرة إلى أشكال مختلفة من البنى 
التحتية للبيانات والآثار المترتبة عليهاء والعواقب الناتجة عن حفظ البيانات والوساطة 
فيها على أساس الربح. ومع ذلكء فمن الواضح أن التحليل النقدي للتغيرات التي تحدث 
ليست مواكبة للتطورات التقنية والتجارية» فالواقع أنه حتى الآن كان هناك عدد قليل من 
الانطباعات النقدية المطبنية على أساس التفكير من خلال الآليات والدلالات في كيفية إنتاج 
البيانات الصغيرة» وتوسيع نطاقها واستخدامهاء والتنظير لأدواتها - قواعد البيانات والبنى 
التحتية للبيانات - التي يتم استخدامها لتنظيم وتبادل وتحليل البيانات. ونتيجة لذلك. 
هناك ندرة في المعرفة المتعلقة بالأنظمة الاجتماعية التقنية الناشئة والمعقدة التي يتم 
إنشاؤهاء مع عدد قليل من دراسات الحالة المعمقة. ومن ثم يتضح أن هناك حاجة للكثير 
من البحث والتأمل لفهم البنى التحتية للبيانات في جميع أشكالها. 
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الفصل الثالث 
البيانات المفتوحة (1(268 2ءم0) والبيانات المرتبطة (10868 0ع1.151) 


بالنظر إلى التكاليف والنفقات والموارد المطلوبة لإنتاج مجموعات البيانات وقيمتها في 
الكشف عن معلومات عن العام من حولناء فقد تم بشكل عام تقييد الوصول إليها بطريقة 
أو بأخرى» فعلى سبيل المثال يُتاح الوصول للمستخدمين المسجلين المعتمدين فقطء أو من 
خلال المطالبة برسوم اشتراك, أو عن طريق حصر الكيفية التي يمكن فيها استخدام البيانات 
بواسطة السياسات والتراخيص. وحتى عندما كانت مجموعات البيانات متاحة ومفتوحة 
عيبا فقل كانت ككالك مغداك وأوؤاظ مكممية لقيميا والوصول البيل كل أحوزة 
الحاسب. والبرمجيات. والمهارات المتعلقة بطرق الإحصاء ورسم الخرائط وا معرفة السياقية 
للحقل أو الموضوع الذي يجري التطرق إليهء مما يتعذى بكثير قدرات عموم الناس. ونتيجة 
لذلك. كانت البيانات وا معلومات المستمدة منها تقليديا مغلقة إلى حدّ كبير بطبيعتها - أي 
مقفل عليها داخل مؤسسة أو محفوظ أرشيفي. وفي الواقع» فقد مثل عدم إتاحة الوصول 
إلى مجموعات البيانات التي يمكن أن تساعد في الإجابة عن أسئلة معينة مصدر إحباط على 
مدى قرون للباحثينء والمحللين. والصحفيينء ومنظمات المجتمع المدني. 

٠‏ ومن هذا المنطلق سعت حركة البيانات المفتوحة لتحويل هذا الوضع جذريًاء ليس 
فقط من خلال فتح البيانات وإتاحتها لإعادة استخدامها على نطاق أوسع فقطء ولكن أيضاً 
من خلال توفير أدوات بحثية سهلة الاستخدام والتي لا تتطلب الحاجة إلى مهارات تحليلية 
متخصصة. وبنيت هذه الحركة على ثلاثة مبادئ هي: الانفتاح» والمشاركة: والتعاون 
(البيت الأبيض 2009 1101156 ء]انط117)؛ فمن خلال الشفافية: والمشاركة: والعمل معاً يمكن 
إدراك قيمة البيانات للمجتمع. وتهدف الحركة إلى تحرير القدرة على إنتاج المعلومات 
والعرقة يدلا من ضر إفكاقة الاستفادة من قؤة البيائات عانى متحييا أو أولتك الذيخ 
يمكنهم دفع ثمن إتاحة الوصول إلى البيانات. وقد تركز الاهتمام, على وجه الخصوص, على 
فتح البيانات التي تم إنتاجها من قبل أجهزة الدولة وغالبا ما يطلق عليها معلومات القطاع 
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العام (251 - مه مطدمكم1 «مءء 5 عتاطناط) أو البحوث الممولة من القطاع العام (انظر 
الفصل الثاني). مع الأخذ بالحسبان بأن هذه البحوث قد تم تمويلها من قبل الخزينة العامة 
لفائدة عامة الناسء مع تركيز أقل على فتح البيانات التي تم إنشاؤها من قبل القطاع 
الخاصء والتي قد يكون لديها قيمة خاصة أكبر عند منتجيها على وجه الخصوص. 

وقد تطورت حركة البيانات ال مفتوحة خلال العقدين الماضيينء بالتزامن مع - ولكن مع 
فصل واضح إلى حدٌ كبير عن - حركة الحق في المعلومات (1511-م0هصمكم1 0غ غداعن8) 
امعنية باتخاذ قرارات الشفافية وصنع السياسات من قبل الوكالات وا معروفة أيشا باسم 
حرية المعلومات (10540522602 04 0032ء1576). وحركتي المصدر المفتوح والعلوم المفتوحة 
المعنيتين بإعادة تشكيل البرمجيات والنشر إلى أشكال مفتوحة وشفافة فيما يتعلق بالترخيص. 
وحقوق الطبع والنشر, وحقوق الللكية الفكرية. فمنذ آواخر سنة 2000م: اكتسبت حركة 
البيانات المفتوحة مكانة بارزة وزخم ثابت بشكل ملحوظهء ابتداء من حملة صحيفة 
الغارديان في المملكة المتحدة تحت مسمى" تخليص بياناتنا- :70 ؟) "10208 2نا0 غ186 
1168 -ع5(7/1 112010ء12/]6مء.16811210131]): ودعوة منظمة التعاون الاقتصادي 
والتنمية ((0180:1 - أعدطمماء7ع10 ته مهاعم 00 عتماممامءظ 101 حم تاه متصمع 1 0) 
حكومات الدول الأعضاء لفتح بياناتها في عام 2008 م, وإطلاق الحكومة الأمريكية في العام 
9 للموقع الإلكتروني (770:01212.807): وهو موقع على شبكة الإنترنت صَمّم لتوفير 
الوصول إلى مجموعات البيانات غير الحساسة والتاريخية التي تحتفظ بها أجهزة الدولة 
على مستوى الولايات ومستوى الحكومة الفيدرالية بالولايات المتحدة الأمريكية. وتطوير 
البيانات ال مرتبطة والترويج ل الويب الدلالي (1170 ءتأصهدد5) كعنصر موحد لتكنولوجيا 
الانترنت في المستقبلء والذي يمكن البيانات المفتوحة والبيانات ال مرتبطة من أن تتصل في 
الغالب بشكل طردي (2009 عع.طآ-وع ممع 8). ومنذ عام 0 م حذت حذوها عشرات 
الدول والمنظمات الدولية على سبيل المثالء دول الاتحاد الأوروي (-«منصتآ صهءمممتاظ 
81)» وبرنامج الأمم المتحدة الإنماني (-عتتصستوعع 220 غدع حدم ماءء(آ مم6 دل عاتملا 
189 ) هيا حعل الآلاف من مجموعات البراقات اللقيدة اها عناسة دده بظبيخها 
للاستخدام غير التجاري والتجاري (انظر 2013 61<ند12]:8186). وقد أسهم في مثل هذا 
التحول في الموقف مجموعات الضغط الدولية والوطنية المؤثرة مثل مؤسسة المعرفة المفتوحة 
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(180112012610 ع05ع1120171 داءعم0) ومؤسسة ضوء الشمس (2086105تاه1 غطاعناصت5). 
ورافقه ضغط من المجموعات والشركات العاملة في مجال الاقتصاد المعرفي, بالإضافة إلى 
كبار موظفي الخدمة المدنية المقتنعين بالحجج المستخدمة: وعشرات الجماعات المحلية التي 
تسعى للاستفادة من البيانات ا مدنية. 

وفي حين يتم عرض حجج حركة البيانات المفتوحة بطريقة بديهية. باستخدام مفردات 
الاستعارة البلاغية مثل الشفافية» والمساءلة والمشاركة. والابتكار, والنمو الاقتصادي, فإن 
الانفتاح السريع للبيانات الحكومية والعلمية ١‏ لق قرهييا غاليا. فالواقع, أن العديد 
من الآثار الاجتماعية والسياسية والاقتصادية لفتح البيانات يجري حاليا الكشف عنها 
ومناقشتها وانتقادها. وعلاوة على ذلكء وللمفارقة إلى حذ ماء تعزز نطاق ومدة حقوق 
الملكية الفكرية على مدى نصف القرن الماضيء بمعنى أن نمو حركة البيانات المفتوحة تم 
بالتوازي مع زيادة في حقوق الملكية الفكرية (2006 ع20110»1). فالمقاومة التي واجهتها 
فكرة توفير حرية الوصول إلى البيانات العلمية نوقشت في الفصل السابقء وسيتم في القسم 
الأخير من هذا الفصل مناقشة الانتقادات الموجهة لدعوى البيانات المفتوحة. فبداية. ومع 
ذلكء يحدّد هذا الفصل خصائص البيانات المفتوحة والبيانات ال مرتبطة.» ومختلف الطرق 
التي هيأت لقضية البيانات المفتوحة. والاقتصاديات المرتبطة بتقديم بيانات مفتوحة؛ وعلى 
الرغم من أن فتح البنانات الحكومية ها بؤال حوفياء قلسن هثالك شك في أن عدرلا كبا 
يحدث بشأن الكيفية التي تتم من خلالها عرض ومشاركة البيانات بشكل عام. 


البيانات المفتوحة (122162 دعم 0): 

عند أحد المستويات. يُعد تعريف مصطلح البيانات المفتوحة بسيط نسبياء فقد حدّده 
بولوك (2006) على سبيل المثال كالتالي: «تكون البيانات مفتوحة إذا كان لأي شخص الحرية 
في استخدامهاء وإعادة استخدامهاء وإعادة نشرها - فقط شرط موافقتها متطلب إسنادها 
و/ أو مشاركتها على حد سواء». ولكن هذا التعريف يلمح إلى الطبيعة المتنوعة بلا يمكن 
أن يكون عليه المقصود من لفظة «الفتح» وكيف أنها يمكن أن تعني أشياء مختلفة بالنسبة 
مختلف الوكالات في سياق حقوق اللملكية الفكرية, فقد يشير الانفتاح إلى الاستخدام 
أو إعادة الاستخدام. أو إعادة الصياغة: أو إعادة التوزيع: أو إعادة النشر والتوزيع, أو 
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إعادة البيع» وقد يكون لكل منها شروط وأحكام تختص بهاء فعلى سبيل المثال قد يكون 
للمستخدم القدرة على استخدام مجموعة البيانات بحرية بموجب ترخيص. ولكن ذلك لا 
يعني إمكانية إعادة التعامل مع هذه البيانات بهدف الربح التجاري أو إعادة البيع, أو 
أي استخدام قد يتطلب الإسناد. وبعبارة أخرىء: قد يكون الوصول إلى مجموعة البيانات 
مفتوحاء ولكن ليس بالضرورة أن يكون كل ما يمكن فعله مع البيانات الممكن الوصول إليها 
مفتوح أيضاً. وفي حالات أخرى, قد تحتفظ المنظمات ببياناتها وتتحكم بإتاحة الوصول 
إليها بنفسهاء ولكنها تتيح بحرية البيانات الوصفية المتعلقة بها فقطء أو قد تسمح المنظمة 
لبعض المستخدمين بالوصول إلى البيانات» ولكنها لا تمكنهم من إعادة نشرها إلا إذا كان ذلك 
سيحقق قيمة مضافة لها وبدون الوصول إلى البيانات الأولية الأساسية. 

ومع ذلك.ء سعت عدد من المنظمات إلى تحديد الخصائص امثالية للبيانات المفتوحة» 
على سبيل المثال يؤكد تعريف الانفتاح بأن العمل هو مفتوح إذا استوفت حالته في النشر 
الشروط المنصوص عليها في الجدول رقم »)25-١(‏ والتي تفرض بعض القيود على الوصول, 
والاستخدام, وإعادة الصياغة, وإعادة التوزيع والنشير.ء وتشجع كذلك بشكل نشط على 
الاستخدام الربحي للبيانات المفتوحة دون أي تعويض مالي لمنشئ البيانات الأصلي. وبالمثل» 
حدّدت منظمة الحوكمة المفتوحة (62060712268م0) تسعة مبادئ للبيانات المفتوحة 
تتعدى مجرد نمط التوزيع إلى النظر أيضاً في طبيعة البيانات نفسها (انظر الجدول رقم 
3-2). وبالإضافة إلى هاتين المجموعتين من الشروط / المبادئ» اقترحت وكالات أخرى مثل 
منظمة التعاون الاقتصادي والتنمية (2008) (0150010) والحكومة الأسترالية (1512867210 
0) حاجة البيانات المفتوحة إلى أن تكون مصحوبة بقوائم الأصول وآليات اكتشاف 
البيانات. من أجل إصدار المؤشرات المتعلقة بجودة البيانات وموثوقيتهاء واستخدام النماذج 
والمعايهر التي تتيح قابلية التشغيل البيني للبيانات ال مفتوحة. وتوفير بنى تحتية سهلة 
الاستخدام للبيانات لتسهيل النشر المنتظم وإيجاد مجموعات بيانات جديدة: بالإضافة 
إلى عدد من الأدوات الأساسية والتخصصية التي من شأنها أن تحسن الاستخدام والتحليل 
للبيانات. ويُعد ضمان التشغيل البيني مهماً بشكل خاص لأنه يسمح بربط مجموعات 
البيانات المختلفة, مما يُسهم في بناء مجموعات بيانات جديدة أكثر تعقيدا واكتشاف رؤى 
جديدة (مؤسسة المعرفة المفتوحة 2012 8011026105 12101716086 داءم0). كما لا توجد 
قيود فيما يتعلق بمجالات التركيز للبيانات المفتوحة - حيث يمكن أن تتعلق بأي مجال 
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من المجالات الاجتماعية. والاقتصادية. والتجارية» والثقافية (وسائل الإعلام وال مكتبات 
والتراث)» والبيئية» أو الظواهر العلمية - ولكنء بشكل عامء ينصب التركيز حتى الآن على 
فتح البيانات التي تتصل بالسياسات العامة عالية المستوى ولها قيمة تجارية عند إعادة 
استخدام مثل البيانات المتعلقة بالاقتصاد. والنقلء والبيانات الجغرافية. 


جدول رقم )7-١(‏ 
الخصائص المْثالية للبيانات المفتوحة المتعلقة بتعريف الانفتاح 
إتاحة الوصول 46655 | ينبغى أن يكون العمل متاحاً بمجموعه ككل وبلا تكلفة إعادة 


إنتاج تتجاوز المعقول كما ينبغي أن تتوفر بشكل مناسب قابل 
للتعديل 


إعادة التوزيع ينبغي أن لا تقيّد الرخصة أي طرف عن بيع العمل أو 
مغن طن ونلع ]1 توزيعه سواء فيما يتعلق بالعمل نفسه أو كان ذلك العمل 
كجزء من حزمة مركنة من أعمال من عدّة مصادر مختلفة. 

وينبغي أن لا يتطلب الترخيص إتاوة أو رسوماً أخرى لهذا 


البيع أو التوزيع. 


إعادة الاستخدام 1656 ينبغي أن يسمح الترخيص بالتعديل على العمل وإجراء عمليات 


الاشتقاق منه ويسمح كذلك بتوزيع الأعمال المشتقة وفقاً لأحكام 
العمل الأصلي. 


غياب القيود التقنية ع©4566 | ينبغي تقديم العمل على الصورة التي لا يوجد معها عقبات 
كطهة]ء تاوء: [دءذعوه1هصطءء: 04 | تقنية تحول دون استخدامه أو إعادة توزيعه. 


الإسناد دمنغنا طم قد يلزم الترخيص الإسناد إلى الممساهمين والمبدعين للعمل 
الأصلي كشرط لإعادة التوزيع وإعادة الاستخدام: وإذا تم فرض 
هذا الشرط فينبغي ألا تتطلب عملية الإسناد إجراءات مرهقة 
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الصحة والنزاهة اتروع )م1 


عدم التمييز ضد الأشخاص أو 
25211251 2101 ستحستى 15ل هآر 


126150115 01 5 


في العمل )نمست 015 110 


ةعم 01 5ل1ع5 أمصتدعة 


توزيع الترخيص 1015111161052 


عععء ا 01 


أعمال عط 046ص أقتتطة ععدعن 1.1 


3125م 2 10 عقععمة 


عدم تقييد الترخيص توزيع 
الأعمال الأخرى 121156 ععمءء 1.آ1 
ده نكتل عطا أعتتاوع* امم 


:701 تاعطأه 01 


من الممكن أن يشترط الترخيص حمل الإصدارات المعدّلة للبيانات 
أسماء تختلف عن العمل الأصلي كشرط لإعادة توزيعها. 


ينبغي عدم تميبز الترخيص ضد أي شخص أو مجموعة من 
الأفخاص وضمان إتاحة الوصول للجميع. 


ينبغي عدم تقييد أي شخص من الاستفادة من العمل في أي مجال 
معين. على سبيل اطثالء لا ينبغي تقييد العمل من استخدامه في 
الأعمال التجارية. 


إعادة توزيعه عليهم دون الحاجة لتنفيذ ترخيص إضافي من قبل 
تلك الأطراف. 


ينبغي أن لا تعتمد الحقوق المتعلقة بالعمل على كونه جزءاً من 
حزمة معينة. 


شعي أن لا يضع الترخيص قيوداً على الأعمال الأخرى التي يتم 
توزيعها جنباً إلى جنب مع العمل المرخص. على سبيل المثاله 
ينبغي أن لا يضر الترخيص على أن تكون كل الأعمال ا مستمدة 





المصدر: مقتبس من 012.018/00:اتططاء لحاء ره / /:صاخط. 
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جدول رقم (7-5) 
مبادئ منظمة الحوكمة ال مفتوحة للبيانات ال مفتوحة 


يجب أن تكون البيانات كاملة تكون كافة البيانات متاحة. مع مراعاة أحكام وشروط 


عاء[محدمء ع6 أقناحط 10266 الخصوصية: والآمن أو قيود الصلاحيات. 


يجب أن تكون البيانات أساسية (أولية) ١‏ تُنشر البيانات كما تم جمعها من اللصدن مع أفضل 
مستوى ممكن من التفاصيلء وليست بأشكال مجملة أو 


1317م ع6 أونقامط 10264 


يجب أن تكون البيانات في الوقت إتاحة البيانات في أسرع وقت ممكن عند الحاجة لها 
اطناسب للحفاظ على قيمة البيانات. 
#إأع مطل عط أقنامط 10266 
يجب أن تكون البيانات في المتناول | إتاحة البيانات لأكبر عدد ممكن من المستخدمين ولأوسع 


عاطزووءءع2 ع5 101156 103166 جموعة من الأغراض. 


يجب أن تكون البيانات قابلة للمعالجة | تنظم البيانات بشكل مناسب للسماح بالمعالجة الآلية لها 
الآلية 


-© 1ط ء2حط عط 1156م 10312 
عاطوووءعء 210 
يجب عدم تمييز عملية الوصول تتوفر البيانات لأي أحد. مع عدم اشتراط التسجيل. 
حطمط عط أقت0اصط ووععع م 


17م أ ستحستى ملل 
يجب أن تكون صيغ البيانات غير | تتوفر البيانات في صيغة لا يكون فيها سيطرة حصرية 
مخصصة الملكية عليها لأي كيان. 


-202 ع6 121156 10112315 102362 


8101177 
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يجب أن يكون ترخيص البيانات مجانياً أ لا تخضع البيانات لأية أحكام في حقوق التأليف والنشر 

وبراءات الاختراع والعلامات التجارية. وقد يُسمح ببعض 

قيود الخصوصية والأمن والصلاحيات المناسبة بحسب ما 
تفرضه التشريعات الأخرى. 


عع1-عع2عع11 ع2 101156 10362 


يجب أن يكون الامتثال قابلاً للمراجعة | يجب أن يتم تعيين شخص كضابط اتصال للرد على الناس 
وإعادة النظر الذين يحاولون استخدام البيانات أو تقديم شكاوى حول 
انتهاكات المبادئ الرئيسية. ويجب أن يكون هناك هيئة 
أخرى ذات اختصاص لتحديد ما إذا تم تطبيق المبادئ 
تشكل مناسشب: 


عاطوسوع نوع عط أمتاحط ععصه تا مصدمن 





امصدر: مقتبس من 1710707.0615010212.015//:صاخط 


وإل حد كير تعد هذه الخضائض اطثالية البياناتاللفنوحة منتجاء ولبست خدمة. .وى 
المقابلء فقد جادل (2013) هاء:615 حول الحاجة إلى إعادة التفكير بالبيانات الفتوحة 
كعملية خدمية (55وعع7010 ءع5617716)- بوصفها تفاعلاً وتنطوي على علاقة بين مزودي البيانات 
والمستخدم النهائي. فبالنسبة له لا يكفي أن تكون البيانات ببساطة متاحة من قبل المنظمات 
لإعادة استخدامهاء بل ينبغي أن يكون فتح البيانات موجّهاً أكثر باعتباره خدمة, مع الأخذ بعين 
الاعتبار حاجات وتوقعات المستخدمين النهائيين منهاء فهذه الإعادة لصياغة المفاهيم تقترح 
عن أولقك الذين يتعجون البيانات اللقموحة اتباع طرقا مخفاقة لإدارة البيافات واللس عد فين 
النهائيينء كالآثار المترتبة على قضايا إعادة تحديد المصدر الخاص بالبيانات. فبالنسبة له 
يتطلب هذا النوع من النهج مشاركة المستخدمين النهائيين في التخطيطء والتطوير وإدارة 
المشاريع الجارية للبيانات المفتوحة» وكذلك استخدام مقاييس لتقييم مدى نجاح مثل هذه 
المشاريع في تعزيز الصالح العام وهذا يتطلب برامج بناء القدرات الرامية إلى رفع مهارات 
المستخدمين ليكونوا قادرين على إدارة ومعالجة وتحليل البيانات بشكل مناسب وفعال. 
ورغم أنه من السهل أن نتفق على أنه ينبغي تسليم البيانات المفتوحة كخدمة:. إلا أن 
البيانات المفتوحة بطبيعتها لا تنتج دخلا أو تنتج القليل مقابل تمويل هذه الترتيبات الخدمية 
فضلاً عن التكاليف المتعلقة بفتح البيانات» فالواقع أن ذلك قد يكون من الطموح إلا إذا تم 
تطوير نماذج تمويل فعالة (كما نوقش أكثر بالكامل أدناه). 
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البيانات المفتوحة والبيانات المرتبطة 


البيانات المرتبطة (12262 0عكلطنآ): 

تتمثل فكرة البيانات المرتبطة بتحويل شبكة الانترنت من شبكة الوثائق إلى شبكة البيانات 
من خلال إنشاء الشبكة الدلالية (2010 زاع181111 2 :2009 عع.آ-وتعصععءظ8) (اءم1 عتأصمصة). 
أو ما اصطلح عليه 2010) عدححر8 4صة 0001034) بمصطلح «المقروءة آلياً على شبكة الإنترنت» 
(ط1116 ع1طه8620-عصنطء3). وتدرك هذه النظرة بأن كافة المعلومات التي يتم تبادلها 
على الإنترنت تحتوي على تنوع غني للبيانات - أسماء وعناوين: وتفاصيل المنتع: والحفائق: 
والأرقام, إلى آخره. ومع ذلكء لا يتم بالضرورة تحديد هذه البيانات نسيقيا على هذا النحىو 
كما أنها ليست منتظمة رسمياً في طريقة يمكن معها جمعها واستخدامها بسهولة, فالواقع, أن 
معظم وثائق شبكة الإنترنت غير منظمة إلى حدّ كبير في طبيعتها. ومن خلال ترميز الوثائق 
وهيكلتها باستخدام معرفات فريدة واستخدام لغة التوصيف (1128ق0ة.] نك11211): بمكن 
جحل البيانات الفى تحنويها هذه الوثائق مركية ومكين الككرين تلقائاً من دمجها: ومالجتهاء 
وفهمهاء وربطها مع البيانات الأخرى ذات الصلة (2010 341116 2). 

ومن أجل همكين شبكة الإنترنت الدلالية من أن تعمل كبيانات مرتبطة, ٠‏ بين -112©15ء 1 
(2009) »ع1 حاجة الوثائق المنشورة على شبكة الإنترنت للمواءمة مع أربعة توقعات 
سلوكية. ولك يجب تعريف الكائنات والموارد ضمن كل وثيقة باستخدام لغة التوصيف 
الموسعة (1:22811286آ زنكآ[2125 ع1اوصع]:8 -.1311) وتسميتها بشكل واضح لا لبس فيه 
باستخدام معرفات الموارد الموحدة (5آ]101- 5تتع اصع ل1 عع ناهووع] منرمكتمتا). فانرا 
ينبغي استخدام الهيكل الضمني لشبكة الإنترنت لربط الوثائق والمعلومات (على سبيل 
المثالء استخدام معيار نقل النصوص التشعبية - أتش في في بي (11:1"15) ومعرفات الموارد 
الموحدة (17115]) بحيث بمكن التنقيب في الأسماء والبحث فيها). ثالثاء تسهيل اكتشاف 
اللعلومات حول كائن. مسق أو مورة (غاى سبيل الغا عندما يقوم شخض بالبخت عن 
معرّف لكائن ماء تقدّم له معلومات مفيدة باستخدام معايير إطار عمل وصف الموارد 
(017آظ1- "اع ه81 منامتكوء10 ءعع1ناه0و1). فإطار عمل وصف اموارد هو وثيقة 
تفصّل وتصف طبيعة معرّفات الموارد ضمن نطاق ما وينبغي أن يُحال كل معرّف إلى 
هذه الوثيقة لتحصيل معلوماته (2010 عمعحوظ ممه 11 2.2. ويضمن استخدام 
هذه المعايير إطاراً مشتركاً لجمع البيانات عبر الإنترنت» بدلاً من اعتماد مجموعة كبيرة من 
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الفصل الثالث 


الأفاليب المتعارضة (016181882012). رازعاء توقير وصلات للربظ بين الكاثتات واموارد 
ذات الصلة, إذا كانت معروفة. بحيث ممكن للمستخدمين اكتشاف المزيد من الأشياء. 


وتمكن هذه التوقعات السلوكية من جعل الوثائق مقروءة آلياً ويمكن معالجتها بحيث 
يكون التعرف على طبيعة الكائنات فيها ممكناً (على سبيل المثال. الولايات المتحدة هي بلدء 
وباراك أوباما هو شخص)». وإزالة الغموض عن المفاهيم (على سبيل المثال» مارس هو قطعة 
شوكولاتة» والمريخ (مارس) هو كوكب؛ أو أن باراك أوباما هو مؤلف وثيقة مقابل أن باراك 
أوباما هو موضوع وثيقة). وإنشاء روابط وعلاقات داخل البيانات (على سبيل المثال» باراك 
أوباما هو رئيس الولايات المتحدة) (2010 عمتحرظ 20د 600104210). وبهذه الطريقة, 
يصبح من الممكن لوثائق شبكة الإنترنت أن تكون قابلة للقراءة آلياً بحيث لا يقتصر عمل 
برنامج القراءة على فهم المحتوى ولكن يمكنه أن يستمد أيضاً بيانات مشتقة جديدة من 
خلال الاستدلال من المحتوى (2010 عطتتوظ لحنه 6000210). 

وعندما تنشر الوثائق بهذه الطريقةء يممكن استخلاص المعلومات على شبكة الإنترنت 
وإعادة تقدهها كبيانات وربطها بطرق لا حصر لها اعتماداً على الغرض. ولكنء وبحسب 
ما دوّن (2010) 2111161 2 فإن «البيانات المرتبطة يمكن أن تكون بيانات مفتوحة؛ ويمكن 
ربط البيانات المفتوحة, ولكن من الممكن أيضاً للبيانات المرتبطة أن تحمل تراخيصاً أو 
غيرها من القيود التي تحول دون اعتبارها مفتوحة». أو إتاحة البيانات المفتوحة بطرق قد 
لا تجعل من السهل ربط بعضها ببعض. وبشكل عام. فإن أي وثائق مرتبطة ليست متوافرة 
على شبكة الإنترنت أو تقع ضمن نطاق نظام اشتراك مدفوع هي أيضاً بيانات مفتوحة 
بطبيعتها. فبحسب ما يرى (2009) ع»6.آ-8612655, ينبغي أن تكون البيانات المفتوحة 
والبيانات المرتبطة متكافئة بشكل مثالي. وإضافة لذلك فقد حدد خمسة مستويات لمثل 
هذه البيانات. كل منها أكثر فائدة وقيمة تدريجيا (انظر الجدول رقم 3-3). وكان تطلعه 
إلى ما أسماه بيانات الخمسة نجوم (المستوى الخامس) - شبكة دلالية عاملة بالكامل. 
ولكن تجدر الإشارة إلى أنه بالنسبة إلى العديد من المنظمات. فإن مجرد الحصول على 
مستويات أعلى من المستوى الأول يُعد إنجازاً وكون المستوى الخامس بعيد المنال عنها دون 
عمالة ماهرة. وموارد إضافية. وأدوات جديدة. 
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الجدول (”7-7) 


المستويات الخمسة للبيانات المفتوحة والبيانات المرتبطة 


كك ككرت كه لاا لال الات اللا 


مقروءة آلياً ولكن بصيغة 
حصرية (على سبيل المثالء 
ملف إكسل). 


مقروءة آلياً باستخدام صيغ 


(على سبيل الثال. صيغة سي 
إس في- 517©) 


مقروءة آلياً باستخدام صيغ 


عامة غير حصرية واستخدام 
امعرفات ووصف اموارد 
(18101 همه 10115]) 


مقروءة آلياً باستخدام صيخ 

عامة غير حصرية واستخدام 
المعرفات ووصف الموارد 

ومرتبطة بالبيانات والبيانات 


الوصفية الأخرى 


البيانات متوافرة. 


باستخدام البرمجيات الحصرية 


/ الاحتكارية؛ كما يمكن 

تصديرها إلى صيغ أخرى. 
يمكن تحليل البيانات 
باستخدام أية حزمة 


برمجية. 


يمكن الوصول إلى البيانات 
من أي مكان على شبكة 
الإنترنت» ومن السهل ربطها 
جنبا إلى جنب مع غيرها من 
البيانات. وإمكانية وصلها 
بالأدوات والمكتبات القانئمة. 
كما في المستوى الرابع» 
ولكن تصبح البيانات أكثر 
اكتشافاً | وتمنج المستخدمين 
وصولاً كاملاً إلى مخطط 
(أنطولوجيا) البيانات 





يتم قفل البيانات في 
الوثيقة ويصعب تحريرها 
لاحقا. 
تعتمد على برامج حصرية 
للوصول إليها واستخدامها. 


هل البيانات على الشبكة, 
ليست البيانات على 
الشبكة. وليست مرتبطة 
بطبيعتهاء ومن ثم هي 
معزولة. 
يمكن أن تزيد زمن تحضير 
البيانات وإدارة البيانات 
وتبادلها. 


للحفاظ على الروابظ 
الداخلة والخارجة. 


المصدر: معدّلة عن منصذ.هغ556402//:صاغط بواسطة 5و[طمءوجه11 اعقطء3/1. 
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الدَّعْوَّى نحو البيانات المفتوحة: 
في حين كان لدى بعض البلدان. مثل الولايات المتحدة. تقليد عريق في جعل بعض 
بيانات القطاع العام متاحة بحرية» وخاصة البيانات ذات الفائدة العالية مثل بيانات 
التعداد. ورسم الخرائطء والطقسء فإن إتاحة الوصولء في بعض البلدان الأخرى» يتم بشكل 
عام من خلال نموذج تغطية التكاليف الذي يتيح البيانات بمقابل مالي وبموجب اتفاقية 
ترخيص معتمدة. ففي المملكة المتحدة. تخضع الوثائق الحكومية لحقوق التأليف والنشر 
الملكية #طعنترمه0 0:ه0) وتحكم البيانات ذات الفائدة العالية بواسطة الصناديق 
التجارية (على سبيل امثالء بيانات الخرائط ضمن هيئة المسح الجغرافية: وبيانات أحوال 
الطقس في مكتب الأرصاد الجوية) التي تعمل بصفة كيانات احتكارية» وتتحكم في الوصول 
إلى مجموعات بيانات رئيسية (2006 عء20110 :2006 1055 2320 #تاطا1ة). وعلى مدى 
العقدين الماضيينء تم تجميع مجموعة من الحجج لبناء دَعْوَى إعادة صياغة دور هذه 
الصناديق وفتح بيانات القطاع العام للجمهور. وبصفة عامة» يمكن تقسيم هذه الحجج 
والاستحقاقات في خمسة أشكالء والتي ينظر إليها على أنها ذات فائدة لكل من حامل 
البيانات والمستخدم النهائي. 
أولاً: حيث أن الكثير من البيانات في إطار الهيئات العامة والمنظمات غير الحكومية تتعلق 
بالعمليات التشغيلية لتلك الهيئات فهي توفر وسيلة يمكن من خلالها قياس مدى 
نجاح مختلف البرامج والأنشطة الخاصة بها. ولذا فإن فتح هذه البيانات للتدقيق 
والرقابة العامة سيجعل أعمال المنظمة وصنع القرار فيها تتمتع بالشفافية ويمكن 
استخدامه لتعزيز ا مساءلة وتقييم القيمة الناتجة مقابل ا مال المستثمر (225562[ 
3 60:02 :2012). وقد تزايدت أهمية هذه الشفافية والمساءلة في الخطاب 
العام في عصر سياسات التقشف ومحدودية الموارد. وفي سياق المناقشات الجارية 
حول المشترياتء والهدرء والعجز الظاهر في الخدمات العامة. 


ثانياً. يسمح إتاحة الوصول للمستخدمين النهائيين لبيانات المنظمةء على زعم البعض. 
برفع مستوى الوعي حيال القضايا المثارة. مما يسهّل الاختيار وصنع القرار فيما 
يتعلق بالخدمات العامة ويشجع على المشاركة الفاعلة والواعية في المجال العام 
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البيانات المفتوحة والبيانات المرتبطة 


(2012 ناذلا :2012 2اء2255[). وعلاوة على ذلكء فإن إتاحة الوصول للمستخدمين 
النهائيين لبيانات المنظمة يعرز المواطنة الفاعلة والمشاركة السياسية في تشكيل 
كيفية أداء وتنظيم الحكم المحلي (2011 عآء2:0 نعل حنهك؟ا سه حدمهط زنت1). 
وهذه. بدورهاء تشجّع الابتكار الاجتماعي. وتعمل على تعزيز العلاقات بين أفراد 
المجتمع» ورفع مستوى النقاش العام (2012 تاالا). ونتيجة لذلكء تمكن البيانات 
المفتوحة من بناء الدموقراطية القائمة على المشاركة. 

يشجّع فتح البيانات حول المنظمة وأدائها على استخدامها هذه البيانات للاستفادة 
في تحسين الكفاءة التشغيلية والإنتاجية من خلال المراقبة واتخاذ القرارات بالأدلة 
والبيّنات المثبتة. وعلاوة على ذلكء. تحصل وحدات الأعمال داخل المؤسسة على 
حق الوصول إلى البيانات وإمكانية استخدامها عبر ا منظمة بكاملهاء مما يؤدي إلى 
رؤى ومعارف جديدة ومزيد من التفكير ا لمشترك والكفاءة (:2012 اع 101 
1 .21 أاء تاعتزة6250؟1). وإضافة لذلكء فإنه يمكنهم اكتساب ملاحظات وردود 
قيّمة وتلقي النصح وا مشورة من الوكالات الخارجية التي تقوم باستخدامهاء وتحليلها. 
وتفسيرهاء مما يرفع من مستوى الجودة. والنزاهة. والفائدة من البيانات. وتؤدي 
هذه التحليلات الداخلية والخارجية إلى تعزيز الحوكمة التنظيمية وإدارة ا مجتمع 
على نطاق أوسع. على سبيل المثال التصدي للغش والتزوير والجرائم الأخرى من 
خلال إنشاء خدمات أكثر فعالية (2011 ع1ع810 ع0 صه7؟ 4صة ددههطزنن11). كما 
أنها همكن من الرصد والتقييم المستمرين لأثر السياسات والبرامج الجديدة (مؤسسة 
امعرفة المفتوحة 2012 2024102ناه8 ع08ع0171ط]ا معم0). 


رابعاً: يُمكن توفير البيانات المفتوحة من إثراء العلامة المميزة, فإتاحة البيانات بحرية يرفع 


من شأن المنظمة: ويدلل على ريادتهاء وروح المبادرة فيهاء ويخدم مهمتها العامة, 
ويزيد مستوى الاتصال والتفاعل مع العملاءء وا مس تخدمين النهائيين ويقود التوجه 
إلى الخدمات المؤسسية (2011 .21 ا 2ع7و162502).: وفي المقابلء يبني هذا الثقة 
والسمعة. ويعمل على تكوين انطباع عن اللعايير الفاضلة للمؤسسة. 
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خامسا: بينما تمتلك بعض مجموعات البيانات المنشئة والقائمة في العلن قيمة اقتصادية هامشية, 
على سبيل المثال تلك المتعلقة بالتراث الثقافي. فإن الكثير من مجموعات البيانات الأخرى 
لديها قيمة تجارية كبيرة. ويمكن استخدام البيانات التي تم إنشاؤها علناً لإضافة قيمة 
إلى البيانات التجارية القائمة. وإنشاء تطبيقات وخدمات جديدة ومن ثم أسواقا جديدة, 
وتحسين المعرفة واتخاذ القرارات للأعمال (2012 اثلا :2012 1825562). ولذا فليس من 
المستغرب عندئذ حرص المصالح الصناعية على الدعوة لفتح البيانات المنتجة علناً لإعادة 
استخدامها في القطاع التجاريء وخاصة البيانات التي طالما غرفت باحتوائها وإمكانية 
إنشائها لقيمة كتلك التي تدار من قبل صناديق تداول القطاع العام (على سبيل المثالء 
بيانات الخرائط). فهناك من يزعم بأن تقييد الوصول إلى البيانات العامة» والتي تم إنشاؤها 
من أجل المصلحة العامة, يخنق الابتكار ويعمل على فقدان وزن مميت للاقتصاد؛ أي أن 
حصر استخدامها فقط لمن لهم القدرة على تحمل تكلفتهاء هو تسعير لإخراج الآخرين من 
السوق (2012 ناذلا :2006 عه20110). ولذا فإن الاستثمار العام في إنتاج البيانات لم يستغل 
بالشكل المناسب كما تم فقدان العديد من الفرص التي من شأنها أن تضفي قيمة على 
نشاطات القطاع الخاص (2012 ناذلا). وإضافة إلى ذلكء فقد تأثير الارتفاع على الاقتصاد 
الشامل نتيجة فقدان القيمة الناتجة عن فتح البيانات العامة (2012 غأناعط):ه210). 


وتتفاوت كيفية احتساب أوزان هذه الحجج الخمس عندما يتم تقدمها عبر الشلعات 
القضائية والسياقات المختلفة؛ ومع ذلك. فهي تشكل مجتمعة نظام ذا منطق قوي حقق 
فواعا ولحوظ ف إقناع المنظمات لفتح البيانات الخاصة بهاء لأسباب ليس أقلها أنها تتوافق 
مع العمليات الجديدة للخصخصة (7111661211553) التي تعزز تسويق الخدمات العامة 
(2012 83665). وفي الواقعء. فإن ال محرك للحجج المتعلقة بفتح البيانات في الغالب هي 
المصالح السياسية والتجارية التي تهدف إلى دفع المؤسسات العامة والمنظمات غير الحكومية 
للحصول على وصول إلى سلعة ثمينة» بدلاً من السعي لتحدي مفهوم الملكية الفكرية في حدّ 
ذاتها (2011 .له أء معتجهوكع؟؟). 

في المقابل: ومما لا يثير الدهشة في هذا السياقء أن الحجج والدعاوى لقطاع الأعمال 
لإتاحة بياناتها بحرية لإعادة استخدامها على نطاق أوسع م يجر تطويرها والترويج لها 
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على نحو كاف. ومع ذلكء فإن العديد من الحجج نفسها لفتح بيانات القطاع العام تصلح 
لبيانات الأعمال أيضاء أو على الأقل عناصر مختارة من هذه البيانات. ففتح البيانات من 
شأنه أن يمكن الشركات من الاستفادة من التحليل والرؤى التي تنتج بواسطة الغير من 
المستخدمين النهائيين» والجمع بين البيانات ومجاميع البيانات الأخرى التي تعمل على 
إثرائهم بطرق مثمرة» وتعزيز التعاون مع الشركاء والموردين مما يصنع فعالية في مجال 
الخدمات اللوجستية والمنتجات الجديدة: وبناء علاقة مع العملاء تساعد على توسيع قاعدة 
العملاء وتعزيز الملف التعريفي للشركة وسمعتها (2012 :1516 1). وعلاوة على ذلك. 
فإنها قد تساعد على تطوير الشراكات بين القطاعين العام والخاصء وفي هذا السياق تم 
اعتماد نهج الابتكار المفتوحء والذي حقق نجاحا فيما يتعلق بالبرمجيات ا مفتوحة. والعمل 
على مبدأ أن تقاسم الموارد سينتج المزيد من القيمة التجارية دون الحرص على اكتنازها 
بغيرة والتحرز عليها. ففي الحالات التي تلقت الشركات الخاصة أموالا عامة للمساعدة 
في البحث والتطوير, يمكن إقامة دَعْوَى على أن أي بيانات تنتج عن مثل هذه المحاولات 
ينبغي أن تكون مفتوحة إما بشكل كامل وإما بشكل انتقائي كوسيلة لإنتاج سلعة عامة 
مثل هذا الاستثمار. 


اقتصاديات البيانات المفتوحة: 

هناك عدد من العوامل الكابحة / المثبطة لفتح البيانات. فبعض هذه العوامل تتصل 
بالمخاوف المتعلقة بقضايا الضمان وا مسؤولية» والمخاوف بشأن الخصوصية والأمنء» والحرج 
المحتمل على جودة البيانات أو مداهاء والكفاءة الفنية لبناء واجهات مناسبة لبرمجة 
التطبيقات (4215 -وعع121112 عطنحستومرعه:2 ددم ندع ناممة) وإدارة البنية التحتية. 
وحتى الآن. فالأمر الأكثر إثارة للقلق, مع ذلك. هو الشأن المالي. فالبيانات قد تكون غير 
متنازعة بطبيعتها. مما يعني أنه من الممكن توزيعها بتكلفة هامشية: نظرياً على الأقل, 
ولكن ينبقن الدع يقابل السسيفة الأولية جما إل جف حغ إدارة افيانات القاقة وجعدمة 
العملاء (2006 عك20110). وعلى هذا النحو. قد تمثل البيانات المفتوحة موردا مجانيا 
للمستخدمين النهائيين» ولكن إنتاجها ومشاركتها والمحافظة عليها هي بالتأكيد ليست دون 
تكلفة معتبرة (خصوصاً فيما يتعلق بالتقنيات المناسبة والموظفين المهرة). ففي كثير من 
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الحالات. كانت هذه البيانات أيضاً مصدراً رئيسياً للدخل للمنظمات, وفي حالة الشركات 
ميزة تنافسية. زمن ثم يرتكز السؤال الأساسي حول كيفية تمويل مشاريع فتح البيانات 
على نحو مستدام في ظل عدم وجود مصادر الدخل الباشر لها. ولذا هناك وجهان لهذه 
المعضلة في التمويل: فمن ناحية هناك التمويل اللازم من قبل الدولة لإنتاج البيانات وجعلها 
مفتوحة. ومن ناحية أخرى هناك التمويل للحفاظ على المبادرات التي يقودها ال مواطنون. 
والذي يعتمد على العمل التطوعي والمنح: ونماذج الأعمال التي من شأنها تمكين الشركات 
التي تستخدم البيانات المفتوحة من الازدهار والتطور. 

ويختلف تمويل خدمات البيانات الحكومية بين البلدان والوكالات. ففي كثير من الحالات» 
تفرض الضرائب لإنتاج ومعالجة البيانات. ولكن في بعض النظم القانونية والحالات» تكون 
خدمات البيانات معقدة بسبب أربعة عوامل: الأول» أن إجراءها يتم بالتعاقد عليها مع 
أطراف ثالثة لإدارتها وتشغيلها بالنيابة عن الدولة. حيث يضيف الطرف الثالث قيمة 
مخصصة احتكارية أو يجعل البيانات متاحة مقابل رسم مالي. وقد حدث هذا مؤخراً مع 
الرموز البريدية الأيرلندية المرتقبة التي سيتم إدارتها من قبل إحدى الشركات نيابة عن 
الدولة وستمول هذه العملية من خلال بيع وترخيص البيانات. الثاني أن البائعين الآخرين 
يتكتلون بنشاط في سبيل وقف تقديم البيانات المفتوحة لأنه يدمر نموذج أعمالهم. ثالثاء أن 
بعض أجهزة الدولة تعمل باعتبارها صناديق تداول تجاريةء فهي لا تحصل على كل تمويلها 
من عائدات الضرائب» ولكن جزءا كبيراً من دخلها قائم على بيع البيانات. فهيئة المساحة 
الأيرلنديةء على سبيل اللثالء تعمل بهذه الطريقة كون أقل من نصف دخلها يأتي مباشرة من 
الدولة في شكل إعانة» ومن المسلم به أن بعض هذه الدفعات التي تتلقاها تأت من وكالات 
حكومية أخرىء ولكنها تأت أيضا من المؤسسات الخاصة وعمليات الشراء الفردية. فإتاحة 
جميع البيانات الخاصة بها مجاناً يقَوْض قدرتها على العمل وتمويل الخدمات الجارية 
لها. رابعاء أن جعل البيانات مفتوحة لا يتمثل بنشرها في شكل محدّد من قبل الدولة 
فقط. فالكثير من البيانات تحتاج إلى إعادة توظيفها وتنسيقها لتمكينها من أن تكون 
مفتوحة (على سبيل المثالء إبهام المصدر لهاء وتجميعها) ووضع أنظمة جديدة في المكان 
ا مناسب لتحقيق هذا الهدف. وهذه ليست عملية هيّنة. وفي أوقات التقشف وخفض 
النفقات يعني هذا إعادة تخصيص التمويل لتغطية نمن هذا العملء الذي هو ضروري 
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أيضاً للخدمات الأماسية. وتعني هذه التعقيدات الأربعة أن التصريحات. في كثير من 
الأحياق: سآن جميع بيانات الذولة قد كم بالفعل تغطية كلفها من خلال فرض الشرائب» 
وأنه ينبغي أن تكون متاحة حرية: هل لببق بسيظة كما تزه لها أن تكون. أما فيما 
يتعلق بالمبادرات التي يقودها المواطنون فهذه أيضاً لديها تكاليف فيما يتعلق بالتوظيف 
والمعدات والخدمات إذا أريد لها أن تكون مستدامة على المدى الطويل. فكيفية تأمين 
هذه الموارد خارج نطاق العمل التطوعي والهدايا تشكل تحني منعيا. حيث تعتمد هذه 
المنظمات. في الوقت الحاضرء إلى حد كبير على التبرعات الخيرية وتمويل الدولة» والتي لا 
يحمئل أيَا منها ضمانات للععديد والالععمران. :ومن :ثم قمن النشائج المحتملة المترتبة علن 
التخفيضات أو التقلبات في القاعدة المالية لخدمات البيانات المفتوحة الانخفاض في جودة 
البيانات, وبط ء الاستجابة, والابتكار, والأداء العام (2006 علء20110). 

وغموما تُجَادل الدعاة للبيائات المففوعة بأن الغياز الأفضل لتاميق قاعدة مالية مسعفرة 
للبيانات المفتوحة من داخل الدولة وخارجها هوعن طريق الإعانات الحكومية المباشرة 
لتكاليفها. ويرى أنصار هذا النهج أن زيادة الإنفاق العام يعوّض في أربع طرق: الأولى: أن 
إتاحة الوصول المباشر إلى البيانات يحد من بعض التكاليف التي يتكبّدها المنتجونء مثل 
التوظيف المطلوب للتسويقء والمبيعات, والتواصل مع العملاءء ومراقبة شروط وأحكام 
الترخيص (2006 عك-20110). الثانية. أنه يمكن للنموذج ال مفتوح الاستفادة من العمل 
الإضافي الحر والابتكار من جموع المستخدمين التي تضيف قيمة معتبرة إلى مجموعات 
البيانات وللمنظمات من ناحية جودة البيانات. وتحليلهاء والمعرفة المستمدة: والمنتجات 
الحديدة والابتكارات. والعلاقات والشراكات التجارية الحجديدة (:2011 .21 اه وعلم؟ ع0 
01غ1ع11011). الثالثة» أن البيانات المفتوحة تنتج قيم فائضة متنوعة للمستهلكينء كما 
تولد سلعا عامة مهمة تستحق استثمار النفقات العامة فيها (2009 ع1ء20110). الرابعة: أن 
البيانات المفتوحة تؤدي إلى منتجات مبتكرة جديدة من شأنها إنشاء أسواق جديدة: وهذا 
بدوره سوف ينتج مداخيل للشركات وإيرادات ضريبية إضافية. وستكون هذه الإيرادات 
الضريبية فائضة عن التكاليف الحكومية الإضافية في فتح البيانات» وبعبارة أخرى فإن نهج 
التكلفة الصفرية أو الهامشية هي أكثر فائدة على المدى الطويل من إستراتيجيات تغطية 
التكاليف واستردادها (المفوضية الأوروبية 2012 55105 أسستطده0 صدءم ه8120 ). 
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ولذاء يعتقد أن فتح البيانات ينطوي على إمكانية إيجاد عدة عشرات المليارات من اليورو 
تهنا في منطقة الاتحاد الأوروبي وحدها (مؤسسة المعرفة المفتوحة 1201716086 ماع م0 
2 10205ه8). ومن الأمثلة المستخدمة لدعم هذا الاعتقاد هو قرار الولايات 
المتحدة بإتاحة بيانات نظام تحديد المواقع العالمية والطقس للجمهور بحرية 2011061 
1 216 اء 1165 ع0 :2006). حيث بهم كل منها صناعات بممليارات الدولارات والتي 
تولك إيرادات ضريبية كبيرة وقؤظلك أعدادا كبيرة من العمال. وقد قدّرت الإيكونوميست 
(غ15دمدمء8 عط1) في العام 2013م بأن ثلاثة ملايين وظيفة في الولايات المتحدة وحدها 
تعتمد على نظام تحديد المواقع. فلو أن أجداً قارن استخدام بيانات الطقس العامة في 
الولايات المتحدة وأوروباء فهناك فرق شاسع في استخدامها وإنتاج قيمة مضافة عنهاء حيث 
يشير (2006) 201101 إلى أنه في حين " تساوي الاقتصادين تقريباً في الحجم, فإن صناعة 
أحوال الطقس التجارية في الولايات المتحدة هي أكبر بعشر مرات من نظيرتها في أوروبا كما 
أن صناعة إدارة مخاطر الطقس الوليدة هي أكبر بمائة مرة منها في أوروبا". وبعبارة أخرى. 
تمّ استخدام البيانات العامة المتاحة علناً بالمجَان أو بقيمتها الهامشية بطرق أنتجت عنها 
قيمة إضافية كبيرة. فأسواق البيانات المفتوحة تتعلق على حد سواء بأغراض مرتفعة (وهي 
فاعدة صغرة من العملا الذين يدقعوق رندما قبرة لقيية مضاقة عاليةهان سيل القال: 
المستهدفين بشكل كبير بالتنبؤات الجوية)» وأغراض منخفضة (وهي تستهدف أعداداً كبيرة 
من الس سعدفن ظلا تقرينة مفباقة مكف حىة الخوية مجان دعوم فق إبراد ات 
الإعلانات؛ على سبيل المثال. تطبيقات حركة ا مرور) (2011 .21 »© 17165 »0). ويتضح 
التأثير المحتمل لفتح بيانات القطاع العام في أوروبا من خلال دراسة أجريت على واحد 
وعشرين مشروعاً للبيانات المفتوحة في عشرة بلدان والتي وجدت أن الانتقال إلى التكلفة 
الصفرية أو الهامشية لتكلفة العمليات التشغيلية زادت عدد المستخدمين ما بين ألف إلى 
عشرة آلاف ف المائة. كما جذبت العديد من الأنواع الجديدة من المستخدمينء ولا سيما 
الشركات الصغيرة والمتوسطة (2011 .21 © 7765 06). وهذا يفصح عن أنه على الرغم 
من أن هناك بعض المكاسب الكبيرة. فقد بين (2013) 83765 أن غالبية الإيرادات الناشئة 
ستنتج عن سلسلة طويلة من الادخار والكفاءة والزيادة المتواضعة من التدوير. 
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وعلى الرغم من هذه الحجج. لم يصدر عن هيئة المحلفين حكم قاطع حول ما إذا كان 
فتح جميع بيانات القطاع العام ممكنا اقتصاديا وبشكل مستدام؛ وخاصة في المدى القصير. 
فهنالك بالتأكيد حالة تتعلق بأن البيانات المفتوحة من الممكن تسويقهاء مما يؤدي إلى 
منتجات عالية ومنخفضة المبستوق والتي يمكن بالتأكيد أن تنتج مصادر للدخل وفرص 
العمل. ومع ذلك وكما بين (2011) .1 © 15165 ع0. فإن متوسط ما يكسبه مطورو 
الفظطيقات هن يشاتيا سكديا ليس سوى ثلاثة آلاف دولار فقطء مع الأخذ بالحسبان أن 
ثمانين بالمائة من تطبيقات الأندرويد امدفوعة يتم م تنزيلها أقل من مئة مرة. وبالإضافة 
إلى ذلكء فقد لاحظوا أنه حتى التطبيقات الناجحة مثل ماي سيتي واي 01671070777 1/17) 
التي تم تحميلها أربعين مليون مرة: م تنتج أرياحا بعد. ذا هود ةلك يسدر عات 
رؤوس الأموال في مشاريع محتملة الربح مع الحاجة إلى نموذج مستدام للأعمال. وقد 
يكون من الجيد أن يستغرق الأمر وقتاً لتطوير ابتكارات وأسواق جديدة؛ فعلى سبيل المثال. 
استغرقت الصناعات القائمة على نظم تحديد ال مواقع سنوات عديدة لتزدهر وتنضج بعد 
قرار جعل البيانات متاحة علناً والذي اتخذ في العام 1984م. كما قد يكون الحال أن بعض 
البيانات لها قيمة كبيرة جدا ولكن دون جدوى اقتصادية. مما يستوجب عادة عدم استمرار 
إعانتها ماليا إذا أريد لها أن تبقى مفتوحة بطبيعتها. 

وفي ظل غياب طرح الاكتتابات الحكومية العامة لجميع التكاليف المتعلقة بفتح البيانات 
الخاصة بهاء يجري النظر في حلول تمويلية محتملة أخرى ولا سيما نماذج الأعمال المختلفة. 
فقد بين (2013) 056112 20 186110 ثمانية نماذج مختلفة لتستخدم, أو قد تستخدم 
لتمويل مبادرات البيانات المفتوحة (انظر الجدول 6-”). ولا تستبعد بعض هذه النماذج 
المختلفة بعضا. في حين تعمل نماذج شبه - مفتوحة أخرى على توفير البيانات مجاناً لإعادة 
الاستخدام غير التجاري» وإلزام معيدي الاستخدام للأغراض الربحية بدفع مقابل ماديء أو 
الدخول في شراكات بين القطاعين العام والخاص حيث يزوّد القطاع العام البيانات وتقدم 
الشركات الخاصة التمويل والخدمات المضافة لإتاحة الوصول وحقوق إعادة الاستخدام 
(2008 0801). وفي نموذج آخرء يمكن بناء تحالف يمتلك مجموعة البيانات. وفرق 
العملء وال موارد والأدوات. ويسهل بناء القدرات» ولكن يتقاضى رسوم العضوية من أعضاء 
التحالف لتغطية الخدمات ذات القيمة المضافة المشتركة. ويتوقف اعتماد أي نموذج. أو 
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الفصل الثالث 


مجموعة من النماذجء على ا مجموعة اللمستهدفة لتحمّل تكلفة إنتاج وصيانة البيانات - 
المستخدمينء المحدّثين / البائعين او الحكومة - وإذا كانت المنظمة تسعى لاسترداد التكاليف 
كاملة أو جزء هامشياً منهاه أو حتى قيمة أكبر من التكاليف الكاملة التي يمكن استثمارها 
مرة أخرى في الخدمة (2013 05112 لخته منترع8 :2009 عكء20110). 


الجدول (6-؟) 


نماذج التمويل مبادرات البيانات ا مفتوحة 


امف اللغية خدمة تقدّم للمستخدمين النهائيين منتجاً عالياً المستوى أو الخدمات 
التي تضيف قيمة إلى البيانات (على سبيل المثال؛ البيانات 
ا مشتقة. الأدوات والتحليل) بمقابل ماديء كدفعة مقطوعة 
ثابتة» أو رسوماً متكررة, أو الدفع - مقابل - الامتخدام ودون 
استخدام حقوق احتكارية. وهذا يتيح لمنتج البيانات الحصول 
على مزايا المبادرة والسبق في مجال تسويق وبيع السلع 
التكميلية. 


5612516 / أ710011 للتاتلمطعوط 


المنتج المجاني / خدمة تقدّم للمستخدمين النهائيين مجموعة متدرجة من الخيارات» 


متضمناً ذلك خياراً مجانياً يشمل عناصر أساسية (على سبيل 
ا مثالء ميزات محدودة أو عينات من مجموعات البيانات)» 

مع خيارات أكثر تقدماً تحقق قيمة مضافة بمقابل رسم مالي. 
تفتح المنتج / الخدمة على سوق أكبر اتساعا وأكثر شعبية 

وا مزيد من الاستخدام العرضي ا ممتدء مع الاحتفاظ بالخدمات 
/ المنتجات المدفوعة. عالية ال مستوىء المتاحة للمستخدمين 

الأكثر تخصصاً. 
المنتجات مفتوحة ا مصدر تقدم عات /خدمات للنستخدمع التيانين مانا دوة 
مقابلء حيث تدعم من خلال سبل التمويل الأساسية الأخرى 
أو غيرها من المنتجات / الخدمات. 


عع العو / أع 1001م تمع رط 


50111 جاعم 0 
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نموذج الهدية الترويجية (البنى 
التحتية على نسق ماكنة الحلاقة 
والشفرات) 


4ه 12201 11تتاع1 تاكة 111 


5ط 


المنصة الموجهة بالطلب 


مم 12م لعغطع 11ه-0 ممع دآ 


المنصة الموجهة بالتزويد 


1201م 2160م 1ه 1م متاك 


التوزيع المجاني مع الإعلان 


كستكتاءء207 طتكصر ععم١‏ 


تطوير العلامة البيضاء 


خداع مطجزماء ع0 اعطها-عغتط7ل1 


البيانات المفتوحة والبيانات المرتبطة 


يعرض المنتج او الخدمة ابتداء بالمجان أو بقيمة مخفضة 
(ماكنة الحلاقة) مما يشجّع على المتابعة بالاستخدام المدفوع 
بمقابل (الشفرات). وقد يكون إتاحة الوصول إلى واجهات 
برمجة التطبيقات با مجان ولكن يكلف هذا الاستخدام 
المحوسب المستخدمين على نموذج دفع المستحقات أولاً بأول 
(بحسب الاستخدام). مع دعم هذا النموذج الأخير (الشفرات) 
للنموذج الأول (ماكنة الحلاقة). 
تقدّم خدمات ذات قيمة مضافة عن طريق تنظيفء وتكرير» 
وتوحيد. وربط البيانات مما يوفر مجموعة قياسية من 
الأدوات التحليلية, وإتاحتها من خلال متجر شامل (متجر 
الشباك الواحد) وتحميل المستخدمين التكلفة من خلال 
التسعير المجاني او المميز (تتصاعد تدريجياً بخيارات 1 و2 
لاكتساب الكفاءة). 
يُعطى مطورو البرمجيات حرية الوصول إلى البيانات لإنشاء 
الخدمات والمنتجات التي يممكنهم بيعها إلى هيئات القطاع 
العام. والتي يمكنها بدورها أن تجعلها متاحة للآخرين من 
خلال نموذج المنتجات المجانية. 
تُقدّم المنتجات / الخدمات مجاناًء ولكن يتلقى المستخدمون 
إعلانا عند استخدام المنتج / الخدمة (المدرّة للدخل) أو 
تقدم المنتجات / الخدمات من قبل شركات مختلفة وتوصف 
بالعلامات التجارية لها لتشجيع استخدام منتجاتها وخدماتها 
الأخرى (الدعم المتبادل). 
يتم إنشاء منتج / خدمة مخصصة للعميل وتخصّص 
لانتخدامه الخاص» مع دقع العميل رسوما لمرة واحدة أو 
اشتراك يتضمن تكاليف الصيانة والتحديث. 





المصدر: جمعت من 2013) 05112 لطة متتيع) . 
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الفصل الثالث 


المخاوف المتعلقة بالبيانات المفتوحة: 

باستثناء الكيفية اللازمة لتمويل مستدام لمبادرات البيانات المفتوحة» والخسائر 
المحتملة للشركات التي قامت ببناء نماذج أعمال قائمة على إعادة بيع بيانات القطاع العام 
(2011 .1 )» 165" »0): سيظهر للوهلة الأولى أن هناك عدداً قليلا من السلبيات الناتجة 
عن فتح البيانات العامة للجمهور لإعادة استخدامهاء وأن هناك العديد من الإيجابيات. 
ومع ذلك. فقد بدأ في الظهور مؤكرا عدد من الانتقادات ال مضادة التي تزعم أن حركة 
البيانات المفتوحة ليست محمودة من الناحية السياسية أو الاقتصادية. حيث إن بعض 
العناصر زائفة في أهدافهاء وعلاوة على ذلكء أن هناك عدداً من التبعات الضارة التي 
يمكن أن تنجم عن فتح البيانات ويتضرر منها بعض المواطنين. ولا توحي هذه الانتقادات 
بفكرة التخلي عن التوجه نحو فتح البيافات: :ولكتى توك سان وكسوب أن كدة مبادراة 
اليبانات المفتوحة أكثر وعيا وتعقلا في إتاحة البيانات. وكيفية استخدامهاء وطرق تمويلها. 
ويمكن تقسيم هذه الانتقادات إلى ثلاث فئات رئيسية: تسهيل البيانات ا لمفتوحة للتوجه 
للخصخصة (تأييد الرأسمالية المطلقة وعدم تدخل الدولة في الاقتصاد) والهيكلة التسويقية 
للخدمات العامة؛ وأنها تروؤج لسياسة توسعية وتزيد سلطة المتسلط؛ وأنها تفتقر إلى 
الاستدامة. والأدوات» وسهولة الاستخدام. 


الخصخصة والهيكلة التسويقية للخدمات العامة: 

برهن (2012) 8265 0و[ على أن «المبادرات المفتوحة مثل البيانات الحكومية المفتوحة 
(0010- 8غ129 دع تصطمء607 دعم 0) تظهر كعملية تاريخية. وليست وقائع محايدة». 
فكما هو الحال مع كل المبادرات السياسية» فإن سياسة البيانات المفتوحة ليست ببساطة 
بديهية أو محايدة بل هي ترتكز على عقيدة سياسية واقتصادية. فحركة البيانات المفتوحة 
متنوعة وتتكون من مجموعة من الدوائر الانتخابية ذات أجندات وأهداف مختلفة: وليس 
الدافع من ورائها مجرد أي طرف واحد منها. ومع ذلكء بينت83:65 بأن عامل الشد السياسي 
في حالة حركة البيانات المفتوحة في المملكة المتحدة كان ضئيلاً حتى بدأت الشركات الكبرى 
تنشط بتكتلها في حملات دعم البيانات المفتوحة, وبدأت المبادرات الحكومية المفتوحة 
تنسجم مع برامج التقشف القسري والهيكلة التسويقية للخدمات العامة. فبالنسبة لهاء 
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البيانات المفتوحة والبيانات المرتبطة 


قد استولت الأحزاب السياسية وقطاع الأعمال على حركة البيانات المفتوحة لصالح المصالح 
الرأسمالية ال مهيمنة تحت ستار أجندة / جدول أعمال الشفافية (2012 وع]82). 


وبعبارة أخرى. فإن جدول الأعمال الحقيقي لقطاع الأعمال هو الحصول على البيانات 
المنتجة بتكلفة باهظة دون أي مقابلء ومن ثم الوصول إلى البنية التحتية المدعومة 
بشكل كبير مما يمكنهم من الاستفادة من الأرباح» وفي الوقت ذاته, إزالة القطاع العام من 
السوق وإضعاف موقعه بصفته منتجا لمثل هذه البيانات. ولذاء فيسبب اختفاء الدخل 
من خدمات البيانات (كما في الحالات التي جرى تمويلها من الرسوم وليس من دافعي 
الضرائب). ومن ثم اختفاء التمويل اللازم لدعم الإنتاج والإدارة المحلية الداخلية. تم دفع 
هيئات القطاع العام إلى الاستعانة بمصادر خارجية لمثل هذه الخدمات من القطاع الخاص 
على أسس تنافسية أو التخلي عن إنتاج البيانات للقطاع الخاص التي عليهم بعد ذلك 
شراؤها منهم (2013 2زء]5:ا). وهناء يتعين شراء خدمات البيانات والبيانات المشتقة 
من البيانات المفتوحة المتاحة بحرية من منشئ البيانات» في الوقت نفسه الذي يتم إفراغ 
المعارف الأولية لبيانات المنظمة. وعلاوة على ذلك. وحيث إن البيانات المفتوحة تتعلق في 
كذر من الأحيان بأنشظة البيعة نفسياء وخصوضا عند اشغمالها عان فؤفر ات قباس الأداء 
الرئيسية. فهي تعمل على تسهيل إصلاح القطاع العام وإعادة تنظيمه مما يعزز الخصخصة., 
وروح الإدارة العامة الجديدة ومصالح القطاع الخاص (2011 1.0280 :2011 صدعآن»ء]/8). 
فمثل هذه العمليات. كما بينت (2013) كه هي جزء من إستراتيجية سياسية مرسومة 
لفتح وإتاجة كافة الخدهات العامة تقرهاً للمنافسة بين مزودي الخدمات من القطاع 
الخاص والقطاعات الأخرى. حيث يعمل فتح البيانات الخاصة بالخدمات العامة على تمكين 
مستخدمي الخدمة من استحداث خيارات معلومة ضمن سوق الخدمات العامة على أساس 
التطبيقات التي تعتمد على البيانات التي ينتجها مجموعة من مطورو القطاعات التجارية 
وغير التجارية (2013, التعبير الأصلي). وفي مثل هذه الحالات» فإن جدول أعمال الشفافية 
التي يرج لها السياسيون وقطاع الأعمال هو مجرد تعبير مجازيء فإذا كان أي من الطرفين 
مهتما حقا في الشفافية والحكومة ال مفتوحة فإنه سيكون داعماً بالتساوي للحق في حركة 
المعلومات والعمل المتعلق بإفشاء الأسرار (2012 مءوومة[) وكذلك تخفيف القيود عن 
حقوق املكية الفكرية على نطاق أوسع (2013 طقطة). وبدلاً من ذلكء فإن الحكومات 
والشركات بشكل عام مقاومة لهما على حد سواء. 
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الفصل الثالث 


السياسات التوسعية وتمكين الممكن: 

هناك جدل ذو صلة يتمثل في أن الغالب في حركة البيانات المفتوحة مدفوع من 
وجهة نظر فنية واقتصادية» ويركز بشكل كبير على إتاحة الوصول إلى البيانات» وليس على 
سياسات البيانات نفسهاء وما قد تكشف عنه. أو كيفية استخدامهاء ومصالح من تصبٌّ 
(2013 طهطة). وبعبارة أخرىء تسعى الحركة بشكل كبير إلى تقديم صورة تظهرها على 
أنها محبّبة وبديهية» وتعزيز الاعتقاد بأن فتح البيانات بطبيعته شيء جيد في حد ذاته. 
وبالنسبة لآخرين, فإن إتاحة الوصول إلى البيانات هو مجرد وجه واحد فيما يتعلق بمفهوم 
الانفتاح» وعلى القدر نفسه من الأهمية هو ما تتكوّن البيانات منه, والكيفية التي يمكن بها 
إنشاء مجتمع أكثر اعتدالاً وإنصافاً. فإذا كانت حركة البيانات المفتوحة تخدم فقط المصالح 
الرأسمالية من خلال فتح البيانات العامة وتحتفظ بالبيانات الاحتكارية الخاصة خلف 
أنظمة جدران الدفع (بمقابل رسوم الاشتراك) وحمايتها بأنظمة الملكية الفكرية» وتمكن 
بصورة أكبر أولئك اممُكنين بالفعل وحرمان الآخرين منهاء فإنها تكون قد فشلت في جعل 
ا مجتمع أكثر دمقراطية وانفتاحاً (2013 طقطة :2011 صفء)وستدق). 

ففكرة أن البيانات محايدة وموضوعية في طبيعتها تُطرح ضمناً في معظم المناقشات 
المتعلقة بالبيانات المفتوحة وأن للكل إمكانية الوصول لهذه البيانات واستخدامها 
(2013 تاهمعططه.[ :2011 صذعغؤ15ن1©). بيد أن القضية ليست كذلك. فمع الاحترام لفتح 
البيانات نفسها يؤكد (2013) دهوصطه[ وجود درجة عالية من الامتياز الاجتماعي والقيم 
الاجتماعية الكامنة ضمنا في بيانات القطاع العام فيما يتعلق بماهية البيانات المنتجة, 
وتعلقها بمن ولماذا (لا سيما في المجالات التي تعمل كأنظمة تخصصية: مثل أنظمة الرعاية 
الاجتماعية: وأنظمة إنفاذ القانون)»» التي تتمثّل مصالحها ضمن مجموعة البيانات وأيضاً 
تلك التي يتم استبعاد مصالحها. وهكذا فإن هياكل القيمة متأصلة في مجموعات البيانات 
والتي تشكل بدورها التصميم والتفسير لها وربما تعمل على نشر المظام وتعزيز المصالح 
اللجحمة 

فالمواطنون متفاوتون من حيث إمكانية الوصول إلى الأجهزة والبرامج المطلوبة لتحميل 
ومعالجة مجموعات البيانات المفتوحة؛ كما أن لهم مستويات مختلفة من المهارات اللازمة 
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لتحليلء وتأطيرء وتفسير البيانات (2011 2ذع]6115). وحتى لو امتلكت بعض ال مجموعات 
القدرة على تقديم فهم مقنع للبيانات. إلا أنهم لا يمملكون بالضرورة الاتصالات اللازمة 
لاكساب التأييد الجماهيري والتأثير على النقاش, أو الحنكة السياسية بمقابل خصم جيد 
التجهيز والدهاء. ومن ثمء فإن الديمموقراطية المحتملة للبيانات المفتوحة مفرطة في التفاؤل» 
إذا أخذ بالحسبان معظم المستخدمين الذين لديهم درجة عالية من المعرفة التقنية وملف 
تعريفي سياسي قائم (2011 صهء81»01): فالواقع أنه يمكن للبيانات المفتوحة أن تعمل على 
زيادة تمكين السلطة وإعادة إنتاجها وتعميق اختلال توازن القوى (2011 5ذعغ]61315©). ومن 
الأمثلة التي يستشهد كثيراً بها على هذا الأخير هو رقمنة سجلات الأراضي في ولاية كارناتاكا 
(121226212): الهندء حيث عمل مشروع البيانات ا مفتوحة. والذي تم الترويج له باعتباره 
مبادرة لصالح الفقراءء على حرمان الفقراء من خلال تمكين ذوي الموارد المالية والمهارات من 
الوصول إلى البيانات التي سبق حجبها وإعادة اقتطاع أراضيهم بوضع اليد بغية الاستيلاء 
عليها (2012 100207212 :2012 عع51 :2011 طاع غ15 ). لقد سهلت البيانات المفتوحة 
في هذه الحالة, وبعيداً عن العمل على مساعدة كل المواطنين» على التغيير في حقوق ملكية 
الأرض ونقل الثروة من الفقراء إلى الأغنياء. وبعبارة أخرىء فإن فتح البيانات لا يعني عملية 
متأصلة في الدمقراطية وتعزيزهاء بل إن الواقع أنه يمكن للبيانات المفتوحة أن تعمل أداة 
للسلطة التأديبية (2013 «طمقصطم][). 


ومن المهم هنا أن التنبّه إلى أن إنتاج البيانات الحكومية يكون لأغراض الحوكمة, 
وهي تتألف من نوعين رئيسيين: الأنشطة المتعلقة بأنشطة الدولة والأنشطة المتعلقة 
بالمواطنينء والأماكن, والأعمال. فالنوع الأول يهتم بكيفية عمل الدولة, وعند إتاحة هذه 
البيانات بشفافية» يمكن استخدامها لتقييم الأداء والمساءلة. وقد يقف قلة ضدّ جعل 
مثل هذه البيانات متاحة للجمهورء على الرغم من الحاجة لتقدير مثل سياسات ال مكاشفة 
هذه. خاصة إذا كانت التدابير المستخدمة ذات تأثير مشوّه لتقديم الخدمة وتعمل على 
التلاعب ببيانات التقييم (بالتوافق مع قانون كامبل -1.307 15اء متهن - انظر الفصل 
السابع). وهذا يؤثر بدوره سلبا في ماهية الخدمات المقدمة وجعل الحياة سيئة لأولئك 
الأشخاص الذين يتلقون الخدمة. ويتكوّن النوع الثاني من السجلات الشخصية والمؤسسية 
الحساسة للغاية: وم يتم إنشاؤها بهدف مشاركتها وتبادلها مع الآخرين. وفي الواقع.» 
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يتوقع المواطنون لها أن تكون محمية بموجب قوانين الخصوصية وحماية البيانات. وحتى 
عندما يتم تجريد هذه البيانات من البيانات التي تشير إلى هوية أشخاص معينين أي 
جعلها مجهولة (7221560ومصةى) وعرضها محجملة. فإنه ممكن للبيانات أن تكون على 
درجة من الحساسية والسياسية بصورة كبيرة. فخذء على سبيل المثالء بيانات الرعاية 
الاجتماعية والصحية المنقحة نسبياً والمجمعة في وحدات مكانية (على سبيل المثالء مستوى 
الحي)» فهذه البيانات تمثل أداة لتوجيه التدخلات الموجهة الرامية إلى معالجة المعوقات 
الاجتماعية كما أن لها إسهامات مفيدة في تحليل البيانات التي تسعي اجتماعياً إلى فرز 
المواطنين والتعريف عنهم فيما يتعلق بالقروض الائتمانية والتأمين ضد ا مخاطرء ويمكن من 
ثم استخدامها لإنشاء ملفات تعريف مناطقية والتي توصم موضعاً ما وتحدّ من الاستثمار 
فيه (انظر الفصل العاشر). وبعبارة أخرىء يمكن إعادة توظيف البيانات لأغراض مختلفة 
بطرق شتى والتي لها مخرجات متباينة» وهناك أسباب مشروعة لتوخي الحذر فيما يتعلق 
بما يتم الإفراج عنه من البيانات الحكومية ومقاومة شعار التبسيط المستخدم من قبل بعض 
المدافعين عن البيانات المفتوحة "إنها بياناتناء لقد دفعنا مقابلهاء وينبغي أن يكون لنا حق 
الوصول إليها". 


الاستدامة والفائدة وسهولة الاستخدام: 

تركز الاهتمام بشكل كبير, حتى الآنء على جانب توفير الوصول إلى البيانات وإنشاء 
مبادرات البيانات المفتوحة» وكان هناك عدم إيلاء اهتمام كاف لاستدامة المبادرات والكيفية 
التي يتم بها استخدام البيانات وتوظيفها. ففي دراسة أجريت على عدد من مشاريع البيانات 
المفتوحة المختلفة أوضحت (2012) .21 ]© عذطاء11 بأن العديد منها تركز بشدة على الناحية 
التقنية الفنية: ويمكن فهم هذه المشاريع على أنها «تزيد قليلاً عن المواقع المرتبطة بملفات 
بيانات متنوعة» ودون أي مراعاة لسهولة الاستخدام, وجودة المحتوى, أو عواقب استخدامها». 
والنتيجة هي مجموعة من مواقع البيانات المفتوحة التي تعمل أكثر كحاويات للبيانات 
أو مكبات البيانات. بحيث تفتقر إلى الصفات المتوقعة في البنية التحتية العاملة للبيانات 
والللكاس لتقي كيدا مثل البيانات النظيفة, ذات الجودة العالية» والتي جرى التحقق من 
صحتها.ء وقابليتها للتشغيل المتبادل بما يتوافق مع معايير البيانات ولها التعريف الوصفي 
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ا مناسب ومجموعات تسجيل كاملة (الوثائق ا مرتبطة بها)؛ أي سياسات المحافظة والنسخ 
الاحتياطي والتدقيق؛ وسياسات إعادة الاستخدام والخصوصية والأخلاقيات. والترتيبات الإدارية 
وآليات تنظيم الإدارة والحوكمة؛ والاستقرار المالي وخطة طويلة الأجل للتنمية والاستدامة 
(انظر الفصل الثاني). كما تفتقد العديد من المواقع للأدوات المناسبة والمواد السياقية لدعم 
تحليل البيانات, وعلاوة على ذلك فإن غالب مجموعات البيانات المنشورة تكون صعبة الأخذ 
والاستفادة منهاء حيث تتألف من تلك التي يسهل نشرها وتحتوي على بيانات غير حساسة 
كما أن لديها فائدة منخفضة ليننا. وفي المقابل,» غالياً ما تبقى البيانات الأكثر صعوبة وتطلباً 
لجعلها مفتوحة في حالة مغلقة. بسبب قضايا حساسيتها أو لأنها تتطلب المزيد من العمل 
الإداري للامتثال لقوانين حماية البيانات (2013 تتهصعونطان). 


ويتمثل جزء من المشكلة في أن العديد من مواقع البيانات المفتوحة هي استجابة عنيفة 
وجاهزة لظاهرة ناشتة؛ وقد تم بناؤها من قبل متحمسين ومنظمات ممن لديهم خبرة 
قليلة في أرشفة البيانات أو الاستخدام السياقي للبيانات التي تم فتحها. وقد تم دعمها 
والترويج لها من خلال الملتقيات المكثفة لمطوري البرمجيات (الهاكاثونات, قدمطغهءاء112) 
ومنتديات العطل الأسبوعية لمجموعات الاختصاص (11765 10368). التي تعيد طرح 
وإنتاج العديد من هذه القضايا. وكما أكد (2013) تقهه2 لمنه (2013) امعكك]3 فإن 
هذه الأحداث والتجمعات التي تدعو المبرمجون والأطراف المعنية الأخرى لبناء تطبيقات 
متام البيانات المفتوحة لها فائدة محدودة. ففي حين أنها تركو الإغكهام على البيانات 
وتعد وسيلة خيدة للتواضكل» إلا أن أولتك الذين يقوهون بالبرمحة غاليا ها يفتقرون إل 
المعرفة السياقية المعمّقة قيما يتعلق بما تشير البيانات إليه» أو ينتمون إلى مجموعة سكانية 
معينة ليست بالضرورة معبّرة عن شريحة مجتمعية أوسع نطاقاً (على سبيل امثالء الشباب 
والمتعلمون والتقنيون)» ويظنون أن المشاكل الهيكلية العميقة يمكن حلها من خلال الحلول 
التقنية. إنهم «كيان مؤلف من مجتمع صغير من المتطوعين المتحمسينء. وليسوا من 
الأشخاص الذين لديهم مصلحة كبيرة في رؤية المشروع ينجح» (2013 2معكآء81). وعلاوة 
على ذلكء لا تزال الحلول التي تم إنشاؤها في هذه اللقاءات على إصدارها الأول» مع قليل 
من المتابعة بعد انتهاء الحدث ودون تحديث أو صيانة أو تطوير لاحق. وكان جواب 
(2013) 202725 لبناء حلول تشرع لتغيير مناسب هو الجمع بين أولئك الذين يفهمون 
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البيانات وال مشكلات القائمة على أرض الواقع مع أولئك الذين يستطيعون برمجة التطبيقات 
وبنائها والمحافظة عليهاء وقد اقترح (2013) 2معك211 عقد اجتماعات تخطيطية مسبقة 
وتوصيات توجيهية بعد الحدث تهدف إلى استدامة ال مخرجات وإنشاء مجتمع على المدى 
الطويل. وبعبارة أخرىء هناك حاجة للتوفيق بين الخبرات الموجودة والخبرات في تطوير 
التطبيقات. والحاجة نفسها مطلوبة مع مواقع البيانات المفتوحة, حيث تتطلب تعلم 
الدروس المستفادة من أولئك الذين عملوا لفترة طويلة سابقة في الأرشفة وقطاع أعمال 
تاذل البباناق: منكسا ذلك أمناد العفو ظات الأرشيقية والعلياء والجفراقيوة: 

ونتيجة لهذه القضايا العويصة المختلفة: وبذلاً من إنشاء دورة إيجابية (78 فنامتط 6/1 
بحسب ما تفترض حركة البيانات ال مفتوحة. حيث الإفراج عن المزيد والمزيد من مجموعات 
البيانات» في المزيد من الأشكال والصيغ: ينتج عنه مزيد من الاستخدامء ومن ثم الإفراج عن 
المزيد من البيانات مستقبلاً إلا أن العديد من المواقع, كما لاحظت (2012) .1ه » وأطاء11 
عانت من انخفاض معدلات التصفح لها وتراجعها لأنها لا تشجع على الاستخدام أو لا تقدم 
التسهيلات للمستخدمين في هذا الخصوصء وتقتصر خدماتها على عوامل أخرى مثل ممارسات 
إدارة البيانات وعرض الجهد المؤسسي المبذول والسياسات الداخلية المعمول بها. فبعد الشرارة 
الأولى من الاهتمام: تراجع استخدام البيانات بشكل ملحوظ للغاية بسبب الكشف عن القيود 
المفروضة على البيانات ومحدوديتها ونضال المستخدمين من أجل إيجاد طرق لكيفية استخدام 
وتحليل البيانات بشكل مربح. وقد لاحظ (2011) 2101645 على سبيل المثال: أن التحليل 
الناشْي عن البيانات المفتوحة كان له تأثير محدود على النقاشات السياسية. وخلص فيما 
يتعلق بنظام المعلومات ا مجمّعة على الإنترنت (كوينز 001115) الخاص بالبيانات اطالية 
الحكومية في المملكة المتحدة: إلى أنه بعد 

هبّة قصيرة من اهتمام وسائل الإعلام في منتتصف عام 2010, وفي أعقاب إطلاقه.... 
فإن التقارير التي تشير صراحة إلى نظام كويُّنز غدت الآن نادرة للغاية» كما أن العاملين في 
الصحافة الذين كانوا الأكثر اهتمامًا بالحصول على حق الوصول إليه قد صرّحوا بأنه م تثبت 
فائدته كمحرّك فاعل للصحافة على وجه الخصوص. 
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وفيت يعم نض البيانات دورياً على سبيل المثالء بصورة فصلية أو سنوية فإن 
الاستخدام بميل إلى أن يكون دودياً وغالباً مرقيظاً بمشاريع محددة مثل التقارير الاستشارية 
بدلا من وجود نمط أكثر ثباتاً من الاستخدام الذي قد يتوقعه اطرء لبيانات تتغير بطبيعتها 
آنياً بصورة مستمرة أو لديها قيمة اقتصادية عالية. ففي مثل هذه الحالات. لاحظت 
(2012) .1 »© عنطاء11 أن مجموعة من حلقات ردود الفعل السلبية قد أبطأت توفير 
البيانات واستخدامهاء ومن ثم زيادة خفض الاستخدام. ولذاء فبعد بعض «المكاسب 
السريعة» الأولية يكمن الخطر في تحوّل أي دورة إيجابية من كونها إيجابية إلى سلبية, 
وتقويض الأساس المنطقي لتمويل الحكومة المركزية بمثل هذه المبادرات وكونها عرضة 
للتوقف المفاجئ. إن المفتاح لتجنب نشوء مثل هذه الدورة السلبية هو التأكد من 
تركيز أي مبادرة بأكبر قدر ممكن على جانب الطلب كما في جانب العرضء وأنها توفر 
للمستخدمين بيانات قابلة للتشغيل المتبادل والأدوات التحليلية وغيرها من الخدمات 
التي تسهل استخدام وإضافة قيمة للبيانات» بدلاً من مجرد ربط الملفات. 


الخلاصة: 

عند أحد المستوياتء تعد قضية البيانات المفتوحة والبيانات المرتبطة بديهية - حيث تسهم 
البيانات المفتوحة في صنع الشفافية والمساءلة والمشاركة والاختيار والابتكار الاجتماعي والكفاءة 
والإنتاجية وتعزيز الحوكمة والابتكار الاقتصادي وتكوين الثروات. في حين تعمل البيانات المرتبطة 
على تحويل المعلومات الموزعة عبر شبكة الإنترنت إلى شبكة دلالية يمكن من خلالها القراءة الآلية 
للبيانات وربطها معاً. وعليه تحمل البيانات المفتوحة والبيانات المرتبطة في طياتها الكثير من 
الوعود والآمال والقيمة مع اعتبارها ما محفوفة بالمخاطرء فواقع الحال بالنسبة للبيانات 
للتفوفة والبيانات اللرضبطة أكث يدا كها أن الأسمى الاققمادية لها لتسحفت واضعة عن 
الإطلاق. ويبدو أن للبيانات المفتوحة والبيانات المرتبطة تكاليف هامشية قليلة, ولكن الحاجة 
قائمة في عملية إنتاجها والطاقم الفني والجهاز المؤسسي لتسهيل استخدامها والحفاظ عليها مما 
يلزم تكاليف حقيقية من حيث العمالة: وا معدات, والموارد. وفي الواقع» فإن البيانات الفتوحة 
بعيدة كل البعد عن كونها مجانية ولكن حتى الآنء مم يتم وضع نموذج متماسك لتمويل مستدام 
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لمبادرات البيانات المفتوحة دون إعانة حكومية. كما أن فوائد البيانات المفتوحة من حيث إنتاج 
قيمة مضافة على فائض الاستهلاك والمشاريع التجارية الجديدة, والمنتجات المبتكرة, والتكاليف 
قد قابلها إيرادات ضريبية إضافية افتراضية إلى حد كبير أو بدأت بالتحقق فقطء وعلاوة على 
ذلك. فإن العواقب السلبية المحتملة لفتح البيانات لم تستكشف بعد بالكامل. 

فهناك حاجة إلى الدفع بمزيد من الاهتمام النقدي لكيفية تطور مشاريع البيانات المفتوحة 
كظاهرة تقنية اجتماعية مقعدة ومرتبطة بطائفة متنوعة من البرامج. والمعنيين» وأصحاب 
المصلحة. وحتى الآن تمحورت الجهود حول العمل السياسي والتقني المتعلق بإقامة مشاريع 
البيانات المفتوحة؛ وم يتم العمل بشكل كاف على دراسة هذه التحركات المادية والتي تلامس 
العدية من السوانب وعورقريا -وكفجة لذلافه كان تفعض إلى قراماك العالة التفصيلية لتظبيق 
مشاريع البيانات المفتوحة» والتجمعات المحيطة بهاء والتي تعمل على صياغتهاء والطرق 
الفوضوية, والطارئة والعلائقية التي تتكشف بمرور الوقت. ولن تظهر صورة أكثر اكتمالاً 
للبيانات المفتوحة والبيانات المرتبطة إلا من خلال مثل هذه الدراسات التي ستكشف عن كل 
من الإيجابيات والسليياة لال قله المشاريع وتوقر إجايات عن أستلة معيازية بهأن الكيفية 
التي ينبغي تنفيذها بها ومعالجة قضايا الاستدامة وسهولة الاستخدام والسياسات المتعلقة بها. 
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البيانات الكبيرة (10262 15ذ8) 


تتبع (2012) 014طء116 وعصه:1 منشأ استخدام مصطلح «البيانات الكبيرة» إلى منتصف 
التسعينيات (19905). حيث استخدم لأول مرة من قبل حون ماثي (إعط1/]25 صطه[): 
كبير العلماء السابق المتقاعد من شركة سيليكون غرافيكس. للإشارة إلى معالجة وتحليل 
مجموعات البيانات الضخمة. وقد كان المصطلح قليل الجذب في البداية. ففي العام ١.١8‏ 
استخدم عدد قليل جدا من الناس مصطلح «البيانات الكبيرة». سواء في المجالات الأكاديممية 
أو الصناعية. وبعد خمس سنوات أصبح مصطلح «البيانات الكبيرة» التعبير الطنان الأكثر 
فنيوعا ف الاسمتخدام في دوائر الأعمال ووسائل الإعلام الشعبية. مع تعليقات دورية في 
الصحف الأكثر انتشاراء مثل صحيفة النيويورك تامز (5ع152' 011لا 97ع81) والفاينانشال 
تامز (وعططة"]' لد كءصحصة): ومقاطع وأعداد خاصة في المجلات العامة والمجلات العلمية 
مثل عام الاقتصاد (20215مع]8) والوقت (ع11526) والطبيعة (ع11نداط). والعلوم 
(©»مءك5). لقد كان هذا الانتشار وزيادة الاستخدام المرتبطة به هو ما أَذى بالفعل إلى 
إعلان غارتتر (تعصاتيه0) في يناير (2013) عن انتقال تقنية البيانات الكبيرة على طول دورة 
الدعاية (عكعتإه »م117) (كما يطلق عليها نموذج النضج التقني) من مرحلة «ذروة تضخم 
التوقعات» إلى «مستوى خيبة الأمل» (2013 16ناء5)» مع إعلان بعض الدعاة سابقاً عن 
موت «البيانات الكبيرة» بصفته مصطلحاً ذا معنى» حيث أصبح مصطلحاً متشعباً وواسع 
النطاق للغاية في التعريف (على سبيل المثالء 2013 6065 06): فبعض أوائل الشركات 
التي تبنت المفهوم تصارع من أجل تحويل الاستثمارات في البيانات الكبيرة إلى عوائد ربحية 
والبعض يشككون في فوائدها المحتملة. ومع ذلكء ظل قطاع الأعمال والقطاع الحكومي 
العام وممولو البحوث على قناعتهم بارتفاع منحنى التنوير ()دعصتصعتطعناصظ 4ه عمماد5) 
للبيانات الكبيرة 25 إلى مستوى الإنتاجية (1717اء2:0011 01 نلوعغ12) عبر دورة 
الإعلان أو نموذج النضج التقنيء بل وأكثر من ذلك. أنها وُجدت لإحداث تغيير جذري في 
كيفية عمل العلوم وإجراء الأعمال (2013 ننةاناءء51: انظر أيضاً للفصلين السابع والثامن). 
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وكما نوقش في الفصل الثانيء فقد وجدت ولفترة طويلة من الزمن مجموعات ضخمة من 
بيانات عبر الحكومات والصناعات والأوساط الأكاديمية التي تم استخراج المعلومات منها 
من أجل تقديم مزيد من الرؤى والمعرفة» فالإدارات والوكالات الحكومية أنتجت بشكل 
روتيني كميات ضخمة من البيانات. على سبيل المثال» قامت إدارة المحفوظات والسجلات 
الوطنية في الولايات المتحدة في عام 7٠١١1‏ بتخزين ما يقارب 65,0 مليون قدم مكعب من 
الوثائق المادية من وكالات السلطة التنفيذية الأمريكية, والمحاكم. ومجلس النواب» ومقر 
الرئاسة (وهي خمسة ف المائة من سجلات الحكومة الاتحادية) مما يضيف ثلاثين ألف 
قدم بصورة خطية سنوياً (2013 1:1115). بالإضافة إلى خمسمائة تيرابايت من البيانات 
الرقمية. كما تم بالمثل جمع بيانات للشركات عن عملياتهاء والأسواقء والعملاء وقواعد 
بيانات هائلة من البيانات العلمية التي تم جمعها ومشاركتها من بداية العلم الحديث. 
لذلك. ما المقصود من مصطلح «البيانات الكبيرة»: بالنظر إلى كميات البيانات الناتجة في 
المجالات السابقة؟ 

فكما هو شأن العديد من المصطلحات المستخدمة للإشارة إلى الاستخدام المتسارع في 
التقنيات وا ممارسات. لا يوجد تعريف أكاديمي محدد أو صناعي متفق عليه للمصطلح 
البيانات الكبيرة» إلا أن الكثير من التعاريف الشائعة تشير إلى الثلاثية المكررة للأحرف 
الابتدائية (3175) للخصاتص المميزة للبيانات الكبيرة: الحجم (ع2ت1ه70؟): والسرعة 
(#أك17610).: والتنوع (2012 .21 اء 105تاوم هكلت :2001 تإعصهرط) (2167ه؟؟). فالبيانات 
الكبيرة تتميز بأنها: 
٠‏ ضخمة في الحجم. أي تتكوّن من تيرابايت أوبيتابايت من البيانات. 
٠‏ عالية السرعة, أي أنها تنشأ بشكل آني أو فوريء أو قريباً من الزمن الحقيقي. 
٠‏ مختلفة من حيث تعدد تنوّعهاء حيث تتنوع البيانات بين المنظمة وغير ا منظمة في 

طبيعتهاء كما تتنوع في الغالب من حيث مرجعيتها الزمانية وامكانية. 

فخلال زمن ما قبل البيانات الكبيرة. تقيّدت قواعد البيانات بين هذه الخصائص الثلاث: 
حيث كان من الممكن لقاعدة البيانات الجمع بين خاصيتين اثنتين في آن واحد (ضخمة 
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وسريعة. متنوعة وسريعة:. وكبيرة ومتنوعة) (2012 0011). إلا أنه مع تعزيز قدرة المعالجة 
الحاسوبية» والتصاميم الجديدة لقواعد البيانات» والتخزين الموزع (انظر الفصل الخامس). 
أصبح تحقيق الثلاثة مجتمعة في وقت واحد ممكناً مما يتيح أشكلاً جديدة للتحليل 
وتقديم عروض مفصلة للغاية للنظم الضخمة وامتغيرة باستمرار. وعدا عن الخصائص 
الثلاث السابقة. أشارت المؤلفات الصادرة مؤخرا إلى عدد من الخصائص الرئيسية الأخرى» 
حيبق تعميز البياناث الكبيرة أيضا بالليزات التالية: 


٠‏ شاملة في نطاقها. حيث تسعى لتغطية كامل مجتمع أو نظم الدراسة (ن - الجميع). أو 
على الأقل توفر حجم عينات أكبر من تلك التي يجري استخدامها في دراسات البيانات 
التقليدية أو الصغيرة. 

٠‏ متناهية في دقتهاء حيث تهدف إلى أن تكون مفصّلة قدر الإمكانء ومفهرسة بشكل فريد 
2 تحديد الهوية. 
مجموعات بيانات مختلفة. 

٠‏ مرنة. حيث تحمل سمات التفرّع (يمكن إضافة حقول بيانات جديدة بسهولة) مع قابلية 
التوسع (يمكن التوسع في حجمها بسرعة). 
(طعنتته11 لصه د31 :2005 صتطء ك1 لصد عى12008 :2012 متهن لصتهة لتزمط 

3 تع تكلنانه له تتعوقء طأطمحكء5 تع تد8/1 :2012). 


وبالنظر إلى الحملة الدافعة إلى التحويل الرقمي (الرقمنة- 101811526102) للبيانات 
التقليدية الصغيرة والتوسع فيها ضمن البنى التحتية الرقمية التي تتميز بالضخامة والتنوع 
مثل ا محفوظات الأرشيفية الوطنية» التعدادات السكانية: وا مجموعات الثقافية والاجتماعية 
التراثية؛ انظر الفصل الثاني). فقد كانت السرعة والخصائص الإضافية هي ما ميزت البيانات 
الكبيرة وجعلت منها ابتكاراً استثنائياً (1997 'صعودع6ؤنقط0) وغيّر بصورة جذرية طبيعة 
البيانات وما يمكن عمله من خلالها (انظر الجدول .)7-١‏ فعلى سبيل المثال» يتميز المسح 
الأسري الوطني بكبر الحجم. والدقة المتناهية. وقوة العلائقية:. إلا أنه يفتقر إلى السرعة 
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(تتغير البيانات مرة واحدة في السنة ). والتنوع (يتكوّن من ثلاثين سؤالاً منظماً). والشمول 
(حيث تقتصر العينة على فرد واحد من عشرين أسرة). والمرونة (كون حقول البيانات 
ثابتة ولا تتغير خلال المسوحات المتعاقبة للتمكن من تحليل السلاسل الزمنية). ففي هذا 
الفصل تم إيراد الخصائص السبعة للبيانات الكبيرة ويناقش الفصل التالي العوامل المساعدة 
للبيانات الكبيرة ومصادرها. 


الحجم (عصتتاه؟2؟): 

شهد العقد الماضي انفجاراً في كمية البيانات التي تم إنتاجها ومعالجتها بشكل يومي. 
وكما عنونت مجلة وايرد (11710) بشكل رئيس في عددها الخاص للعام 2008: نحن ندخل 
«عصر التيرابايت» (وفي الواقع» لقد ولجنا بالفعل في عصر الزيتابايت؟؛ 7002 بايت). وقد 
سعت العديد من الدراسات لتقدير وتتبّع الأحجام المعنية (على سبيل المثالء 4ه ه1115 
1 316 أء غ1مط5 :2011 لعءوطلعظ 220 غخطه0 :2009 2ءم1]6). واستخدمت هذه 
الدراسات منهجيات وتعاريف مختلفة» ولكنها أجمعت بالكلية على أن معدل نمو البيانات 
كان شيا في نطاقه. وعلاوة على ذلك. فهي قائمة على النمو باطراد أكبر في ال مستقبل 
المنظور. إن أبسط طريقة لتوضيح هذا النمو هو إعطاء بعض الأمثلة على تقديرات عاطية 
لأحجام البيانات وبعض التقديرات المتعلقة بكيانات محددة: ولتوفير إطار مرجعيء يفصّل 
الجدول )6-١(‏ بصورة مختصرة كيفية قياس حجم البيانات. 

)6-١( الجدول‎ 


مقاييس البيانات الرقمية 


هي اختصار لتعبير «الخانة الثنائية». حيث تستخدمه 
الحاسبات لتخزين ومعالجة البيانات على صورة الرمز 


الثنائي (0 أو1) 


ثمانية خانات ثنائية | مساحة تخزينية كافية لتمثيل رموز الأبجدية الإنجليزية 
(8 بت) والأرقام باستخدام الرموز الثنائية 
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البيانات الكبيرة 


كيلوبايت 0 أو210 بايت | من كلمة «الألف» (160550) باليونانية. فالصفحة 
(8]) الواحد من النص المطبوع تقدّر بحوالي 2 كيلوبايت 


من كلمة «ضخم» (1:2186) باليونانية. فكامل أعمال 

شكسبير الأدبية يقدّر حجمها ب 5 ميجابايتات في حين 

يقدّر حجم ا ملف الصوق ال موسيقي بحوالي 4 ميجابايت 
0 ميجابايت؟؛ من كلمة «هائل» (26ة1) باليونانية. ففيلم من ساعتين 

0 بايت يمكن ضغطه في ملف حجمه 2-1 غيغابايت 
تيرابايت (18) | 1000 غيغابايت؛ من كلمة “عملاق' (7ع71051) باليونانية. فالكتب 
ففذبايت. 2 | اللفهرسة قفكنية مجلس النوابٍ الأمريق (الكوكرس) 
يقدّر حجمها بحوالي 15 تيرابايت 


بيتابايت (58) | 1000 تيرابايت؛ 250 | تقذر بيانات كل الرسائل التي تمّ توصيلها من قبل خدمة 


إكسابايت 0 بيتابايت؟ | مكافتئة لبيانات عشرة بلايين نسخة من مجلة عام الاقتصاد 
)68 0 بايت ()قتمتمدمعءظ عط1). 


زيتابايت (78) أ 1000 إكسابايت؛ | يقدّر المجموع الكلي للمعلومات في الوجود في عام 2010 
0 بايت بحوالي 1.2 زيتابايت 


يوتابايت (98) أ 1000 زيتابايت؛ 
0 بايت 


لد با البريد الأمريكي في العام 2010 بنحو 5 بيتابايت. 


تم وضع الاختصارات من قبل المنظمة الحكومية الدولية مناه تتصدع 0 21عصصء مع عنصل 
وال مكتب الدولي للأوزان والمقاييس 1265ه5دء2/1 لطه دغطعاء11 4ه نتدعقند8 لهمه نه صمعغم1. تم 
إضافة وحدق يوتابايت وزيتابايت في العام 1991؛ المصطلحات للكميات الأكبر مم يتم وضعها بعد. 





المصدر: مجلة عام الاقتصاد (2010) (156<:ودمء1 16). تم إعادة إنتاجها بإذن عام الاقتصاد. صحيفة عام 
الاقتصاد المحدودة. لندنء الإصدار 11 مارس 2014. 

وقد بين (2012) .21 »© 105ناهمم ه7112 أنه في العام ١٠٠٠م‏ تم تخزين 6٠٠٠٠٠١‏ بيتابايت 
من البيانات في العالم. وبحسب التقرير السنوي ل (2011:7) .له © 6مط5- كم كم 
ا معلومات؟ - عالجت خادمات العام للعام ١٠٠م,‏ 9.57 زيتابايت من المعلومات... وكان 
هذا معدل ١١‏ غيغابايت من ال معلومات يوميا للعامل العاديء أو نحو " تيرابايتات من 
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المعلومات لكل عامل سنوياً. وقامت الشركات في العالم بمعالجة 77 تيرابايتاً من المعلومات 
سفويا باشتكناء اللضادر غير اللحوسية: ويحلول غام 1+" ع قذرت مؤسمة إواسي آي 
(31061) (بحسب ما ذكر 3 :2011 .1 ]© 4ع لنتوصة/8) بأن الشركات عالياً قد قامت بتخزين 
أكثر من ٠‏ إكسابايت من البيانات الجديدة على الأقراص الصلبة ... في حين قام المستهلكون 
بتخزين أكثر من 7 إكسابايتات من البيانات الجديدة على أجهزة من قبيل أجهزة الحاسب 
الشخصية وأجهزة الحاسب المحمولة. كما قدّروا كذلك أنه في «عام 7٠٠١9‏ م كان ما يقرب 
من كل القطاعات في الاقتصاد الأمريي لا يقل بياناتها المخرنة بالمتوسط عن 7٠١‏ تيرابايت 
من البيانات لكل شركة فيها أكثر من ألف موظف. كما امتلكت العديد من القطاعات أكثر 
من 1 بيتابايت من البيانات المخزنة لكل شركة». وفي عام ٠١١1‏ م أشار وعمس] عناءءلل 
مفوّض الاتحاد الأوروبي لجدول الأعمال الرقميء بأن ١1‏ مليون بليون بايت من البيانات 
يجري توليدها في الدقيقة الواحدة على مستوى العام (2013 8181). 


وبناء على مراجعة (2011) .21 أ» 21277112 لنمو حجم البيانات. فقد توقعوا 
ارتفاعاً بنسبة ٠‏ في المائة في نمو البيانات التي يتم إنشاؤها على مستوى العام سكديا 
وقذر (2011) اءمصنعظه لصه عخمهدو بأن «كمية المعلومات التي تم إنشاؤها وإعادة 
نسخها (تكرارها) على الإنترنت ستتجاوز ١,8‏ زيتابايت ١,8(‏ تريليون غيغابايت) في 
العام 7٠١١١‏ مخزرنة في 02٠١‏ كوادريليون (مليون مليار) ملف بيانات». ويبين هذا الذي 
ذكروه ف بمقدار تسعة أضعاف خلال خمس سنوات فقطهء مع نمو متوقع في ذات 
الوقت إلى أكثر من الضعف كل سنتين. ونتيجة لذلكء فقد توقعوا في تقريرهم بأنه في 
العقد التالي: 

سيزداد عدد الخوادم (الاقتراضية والفيزيائية) في جميع أنحاء ء العام بعشرة أضعاف» 
في حين ستزداد كمية المعلومات امدارة في مراكز بيانات الشركات بمقدار خمسين نا 
وسيزداد أعداد املفات التي سوف تضطر مراكز البيانات إلى التعامل معها بمقدار نا 
على الأقل. 

وبمثل هذا النمو الهائل في إنتاج البيانات. ادعت شركة آي بي أم (2012) 182/1 
بأن «10* من البيانات في العام اليوم قد تمّ إنشاؤها في العاميين الماضيين فقط» 
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كما توقع (2012) .21 105:هم2110 أن تقارب أحجام البيانات حدّ 0 زيتابايت 
بحلول عام كم 

ويمكننا إدراك وقوع هذا الانفجار في إنتاج البيانات الرقمية من خلال النظر في بعض 
الأمثلة المحددة. فشركة تك أمريكا (1162ءمتشطءع1) قرت بأنه يجري بويا إرسال ما 
يقرب من 114 مليار رسالة بريد إلكترونية و6١‏ مليار رسالة نصية. كما يتم إجراء ١١‏ مليار 
مكالمة هاتفية على مستوى العام (2013 صقدده11 لصة حصطامىة5). مدففا لشركة سيسكو 
(1500©) ففي العام "١17‏ م كان هنالك تقر يبا ما يثائهن ١:‏ ملياراك غتصر (أخيرة اقضال 
ومستشعرات) مشكلة شبكة إنترنت الأشياء (101- مقصنط1' 04 أعصمعغم1): والتي يقوم كَ 
منها بإنتاج كميات متغيرة من البيانات, مع الزيادة المتوقعة لهذا الرقم ليفوق الخمسين 
ملياراً بحلول عام ٠١٠١‏ م (2013 #داعة1). أما ما يتعلق بحركة الاتصال على الإنترنت. 
فقد كانت شركة جوجل تعالج ٠‏ مليارات طلب استعلام للبحث يومياًء وتقوم بتخزينها 
عميعا (2013 اع لكلنات 220 تتعع 0121 دك 1-5ع:21377): وقرابة 56 بيتابايت من البيانات 
كل يوم (2012 .21 اء +تهمصدء1227). وفي العام 75١١١‏ م قضى المستخدمون النشطون 
موقع التواصل الاجتماعي فيسبوك أكثر من ,9 مليارات ساعة خلال شهر (© معلتترصه1ة 
1 .381). وبحلول عام 7٠١١7‏ م: ذكرت الشركة بأنها كانت تعالج 7,0 مليار من مختلف 
أنواع بيانات المحتوى (وصلات. مخازنء صورء أخبار وما إلى ذلك)» ولا,؟ مليار من ردود 
الإعجاب وثلاثمائة مليون عملية تحميل للصور فؤفينا (2012 عصتاقده0). كما تم إنتاج 
أكثر من أربعمائة ماوق قخريوة وميا في العام 17١م,‏ بمعدل زيادة مقداره مثتان 
في اطائة حون مع احتواء كل تغريدة على ثلانة وللانين هدا من البيانات الوصفية 
لها (2013 تتعتكلتات لطنه عتععنء امم طاء 5 -تعجة13/1) . وكسة الكثير من هذه البيانات غير 
منظمة بطبيعتها. وبالمثل هنالك انفجار في حجم إنتاج البيانات المنظمة قد وقع أيضاء على 
سبيل المثال» وفيما يتعلق ببيانات تجارة التجزئة الخاصة بالأوراق المالية والمبيعات: والتي تم 
جمعها من خلال السلاسل السوقية (اللوجستية) ومنافذ البيع. أنتجت سلسلة متاجر وول 
مارت (105131) أكثر من 0,؟ بيتابايت من البيانات المتعلقة بأكثر من مليون عملية خاصة 
بالعملاء في كل ساعة في العام ؟١١٠م,‏ «أي يفوق ما يعادل 1717 مرة من المعلومات الواردة 
في جميع الكتب المصنفة في مكتبة الكونغرس»؛ 6 :2012 ع226ذ !الى #عغدءع0 10268 مصعم 0)., 
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كما أنتجت متاجر تسكو (16560) البريطانية أكثر من ١,5‏ مليار ننداً جديداً من بنود البيانات 
كل شهر في العام ٠١١١‏ م (2011 .21 ا مكاتقصة/3). 


وبا لمثلء تنتج الحكومات والهيثات العامة كميات هائلة من البيانات حول مواطنيها 
والدول الأخرى. على سبيل المثال» بدأت هيئات التنقل والعبور في مراقبة التدفق المستمر 
للناس من خلال أنظمة النقلء على سبيل المثال. جمع زمن ومكان استخدام بطاقات السفر 
مسبقة الدفع مثل بطاقة أويستر في لندن. كما يجري الآن تقديم العديد من نماذج وطرق دفع 
الضرائب أو طلبات الحصول على الخدمات الحكومية من خلال الانترنت» ففي العام 2009م 
أنتجت حكومة الولايات المتحدة 668 بيتابايت من البيانات (مؤسسة التقنية الأمريكية 
2 701102105 63 11ء سخطءء1). كما تعمل وكالات الاستخبارات الست عشرة التي 
تشكل أمن الولايات المتحدة, جنباً إلى جنب مع فروع الجيش الأمرييء على مراقبة وتخزين 
وتحليل كميات هائلة من البيانات كل ساعة. من خلال آلاف ال محللين العاملين في تدقيق 
وتفسير النتائج. وللحصول على فكرة عن حجم بعض مشاريع الاستخبارات العسكرية. فإن 
مشروع النظام المستقل للمراقبة الأرضية الصورية الحقيقية (416175-15). والذي كشفت 
عنه وكالة مشاريع البحوث المتطورة الدفاعية (داربا 14124) وجيش الولايات المتحدة في 
العام ٠١11‏ م هو منصة للمراقبة بالفيديو بدقة 1١,8‏ غيغابايت والتي ممكنها بيان التفاصيل 
الصغيرة حتى ست بوصات من ارتفاع ٠٠٠٠١‏ قدم (ستة كيلومترات) (2013 ت«مطاصهم). 
ا مليار بكسل» في ١7‏ إطاراً في الثانية ( لقطة في الثانية ), مما ينتج ما يقارب 

غيغابت في الثانية. وهذا يعادل نحو 5 بيتابايتات من البيانات يوميا. وباستخدام 
الحاسوب العملاق يمكن للنظام إعراء الععايل آنا من خلال تتح مايصل إل 38 جسها 
0 ضمن مجال الرؤية. وهذا هو مشروع واحد فقط في ترسانة المشاريع الاستخباراتية 
المماثلة وذات الصلة. 

وبالمثل» فيما يتعلق بالمشاريع العلمية» يتكون تسلسل الجينوم البشري من نحو ٠٠١‏ 
غيغابايت من البيانات (2012 عاءع11823): وهذا يتضاعف عبر الآلاف من الأفراد مما 
يوسع قاعدة البيانات قريباً إلى تيرابايت وبيتابايت من البيانات. وعندما بدأ التشغيل 
في مسح سلوان الجوي الرقمي ((5017 5197 10181121 صده51) في العام 5٠٠١‏ أنتج 
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المرقاب (التلسكوب) في نيومكسيكو من بيانات الرصد وامراقبة في أول شهرين أكثر مما 
سبق جمعه في تاريخ علم الفلك حتى ذلك الوقت (2010 #عكادت). وفي عام ٠٠٠١‏ م 
بلغ حجم أرشيفها ما يقارب ١١‏ تيرابايت من البيانات. وهي كمية سيتم قريباً جمعها 
كل خمسة أيام من قبل المرقاب الكبير للمسح الشامل (51015(7 عن م57:00 غ128 
عم16560ع1) والذي يندا العمل به في شيلي في العام 2016 م(2010 01 ). وأكثر 
ضخامة من هذاء مصادم هادرون الكبير (7ع1110آهن صمعل112 عع 2ه.1) والذي يقوم بإنتاج 
٠‏ تيرابايت من البيانات في الثانية الواحدة (2010 ,أونتصةمصمءظ عط1). وفي هذاء 
وغيره من الحالات: يتم إنشاء بيانات هائلة للغاية لا يمكن تحليلها أو تخزينهاء بحيث 
تعد بيانات عابرة. وفي الواقع. لا وجود لهذه القدرة التخزينية لكل هذه البيانات. فعلى 
الرغم من التوسع السريع في القدرات التخزينية» إلا أن هذا التوسع لا يمكنه مواكبة إنتاج 
البيانات (2011 .21 اع معلأتوصدك/ا :2007 .21 أء عاصدك). 


الشمول (2115151657دل:1): 

تستخدم عملية انتقاء العينات في دراسات البيانات الصغيرة من أجل إنتاج مجموعة 
بيانية تمثيلية لمجتمع الدراسة من جميع البيانات المحتملة في وقت معين ومكان معين. 
وتستخدم عملية انتقاء العينات من مجتمع الدراسة بسبب كبر هذا ال مجتمع وتعذر جمع 
كافة البيانات المتعلقة به لمحدودية الوقت والموارد المخصصة. في المقابل. تسعى مشاريع 
البيانات الكبيرة إلى التقاط بيانات كامل مجتمع الدراسة (ن - الكل). أو على الأقل. حجم 
عينة أكبر من المعتادة في دراسات البيانات الصغيرة (#عكلنات تنه تععلء طامط 1-5ع:2/127 
3. فمن ناحية, تعد هذه البيانات نتاجاً ثانوياً للتقنيات التي استخدمت في إنتاج 
البناتات جتنا إلى جنب مع النمو الهائل في القدرة على تخزين البيانات (انظر الفصل 
الخامس)» ومن ناحية أخرىء هناك قناعة بأن "الأكثر هو أفضل" وسيقدم تقلا كبس ومويدا 
من الدقة والصحة في التحليل. 

وفي النظم المفتوحة مثل المشاريع العلمية الكبيرة, كتلك التي تقيس البيانات المناخية 
للإبلاغ عن الطقس ونمذجة الأرصاد الجوية: أو جمع البيانات الفلكية باستخدام مرقاب 
قويء يكون التوجه نحو مجموعات بيانات أكبر بكثير. مع زيادة أحجام العينات عبر العديد 
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من المتغيرات ما أمكن ذلك. ولا يعني ذلك في علم الفلك. على سبيل المثالء مجرد جمع 


بيانات الضوءء ولكن أيضا البيانات من مختلف ألوان الطيف الكهرومغناطيسيء وبدقة 
عالية لأكبر قدر ممكن. أما في حالة النظم المغلقة. مثل الفيسبوك أو شراء السلع من 
متجر على شبكة الإنترنت مثل أمازون أو إرسال رسائل البريد الإلكتروني؛ فمن الممكن 
تسجيل كافة التفاعلات والعمليات التي تحدث, بالإضافة إلى مستوى عدم التفاعل. وفي 
هذه الحالات. هذا هو الواقع بطبيعة الحالء فموقع التواصل الاجتماعي الفيسبوك يقوم 
بتسجيل كل نشرء أو سجيل الإعيجابيه أو رفع لصورة يتم تحميلهاء أو وصلة إلى موقع آخرء 
أو رسالة مباشرة. أو لعبة لعبتء أو فترات الغيابء وما إلى ذلك لكل مستخدميه الذين 
ناهزوا المليار أو نحو ذلك. وبا مثلء لا تسجّل شركة الأمازون فقط تفاصيل كل عملية شراء 
والمشترين. ولكن أيضاً جميع الروابط التي تم زيارتها وكل السلع التي تم استعراضها من 
خلال موقعهاء بالإضافة إلى كافة البنود التي تم وضعها في سلة التسوق وم يتم شراؤها. 
كما يتم تسجيل كافة رسائل البريد الإلكتروني من قبل الخادمات التي تستضيف صندوق 
البريد الإلكتروني للعميل. وتخزين كامل البريد الإلكتروني وجميع البيانات الوصفية المرتبطة 
به على سبيل المثال» الذين تم إرسال البريد الإلكتروني لهم أو استلامه منهم: والوقت / 
التاريخ» والموضوع. والملفات ال مرفقة. وحتى لو تم تحميل البريد الإلكتروني محلياً على جهاز 
المستخدم وتم حذفه فما زالت نسخة محفوظة منه على الخادم؛ هذا مع احتفاظ معظم 
المؤسسات والشركات بهذه البيانات لعدد من السنوات. 

وبالمثل بالنسبة للأشكال الأخرى من البيانات, فقد نمت البيانات المكانية بشكل كبير في 
السنوات الأخيرة» وذلك من خلال الاستشعار الآني عن بعد والصور الرادارية» إلى المشاريع 
الكبيرة مكتظة ال مصادر مثل مشروع خرائط الشوارع المفتوحة («12لاءءتاكمءم0)., 
وا مسارات المكانية الرقمية التي تم إنشاؤها بواسطة مستقبلات أنظمة تحديد المواقع 
العفرافية الشتبةواكل الجيية: وبيدق السهاة: الأذلاق إل أن يكوا امل مكاتا: 
بحيث تجمع التضاريس للكوكب الأرضي بأسره. ورسم خرائط البنية التحتية لدول بأكملها 
وتوفير مجموعات بيانات مشتركة ومرحّصة للخرائط. في حين يوفر المشروع الثالث القدرة 
على تتبّع وتعقب الحركة عبر الفضاء بمرور الوقت؟ وبناء مسارات الزمن - الفضاء التي يمكن 
تجميعها لتوفير نماذج الزمن - الفضاء للسلوك عبر مدن ومناطق بأكملها. وتمكن مجتمعة 
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من النمذجة ال مفصّلة للأماكن وطرق التنقلء والمقارنة المسحية عبر الفضاء. واستهداف 
التسويق لمجتمعات معينة. وتقديم خدمات جديدة معتمدة على الموقع: والبيانات التي 
يمكن الجمع بينها لاشتراكها في المرجعيات المكانية لإنشاء قواعد بيانات وتطبيقات جديدة 
مكن البعث مقانا فيها (على سبيل اللغالجمع النباقات حول منطقة لإنقباء.ملقاتك 
تعريفن للحي). 


وبالنظر إلى التقدم الحاصل في سعات التخزين (انظر الفصل الخامس»» يبدو أننا قد وصلنا 
إلى مرحلة بحيث يكون من الأسهل في كثير من الحالات تسجيل كل شيء: دون الحاجة إلى فرز 
البيانات» وتدقيقهاء وأخذ عينات منهاء وتسجيل ما يحتمل أنه مفيد منها فقط (ومن الذي 
يعرف ما يثبت احتمال أنه مفيد في ا لمستقبل؟). وكما أشار (2012) .21 »© 5ه1تاهممع711: «لا 
عجب أننا نغرق في البيانات» فإذا كنا نستطيع تتبع وتسجيل شيء ماء فإننا بالعادة نفعل». 
وفي الواقع» أشار (7 :2012) النطصدن<1 إلى أن المبدأ الأماسي خلف البيانات الكبيرة هو «عندما 
تستطيع, احتفظ بكل شيء». ويتجلى هذا بالاعتقاد بأنه كلما كان المزيد من البيانات متاحا 
سنحت فرص أفضل لصنع رؤية أكثر صحة ونفاذا... وفرص العثور على «المنتجين» لنظرية 
جديدة (850172 تراءء5 2ط0[ مقتبس من 8 :2010 8011161 ). وعلى الرغم من ذلك. تسهم 
إستراتيجية السعي نحو الشمولية بشكل كبير في طوفان البيانات» ويتمثل التحدي الأكبر في 
رؤية النمط الشامل والصورة الكبيرة من جملة التفاصيل وتمييز الغث من السمينء وإثارة 
مجموعة من الأسئلة الأخلاقية فيما يتعلق بنطاق البيانات التي يتم إنتاجها والاحتفاظ بهاء 
والاستخدامات التي يجري توظيفها فيها أو من اممكن توظيفها فيها (انظر الفصل العاشر). كما 
أنها تثير تساؤلات معرفية أساسية (11011012012). على سبيل المثال وبالنظر إلى شموليتهاء 
تساءل (2012) غتنهط02116 عما إذا كانت تحليلات البيانات الكبيرة هي علم ما بعد الاختزال 
(أكذكناء سلء:-5056)» وسيتم مناقشة هذه الأسئلة بممزيد من التفصيل في الفصل الثامن. 


الدقة والتبويب/ الفهرسة (16لهءن2ء120 له دم تأس1مدع18): 

بالإضاقة إلى شهولية البيانات» أصبحت البيانات الكبيرة أكثز تناهيا فى :الدقة يكثره 
وهاتان الخاصيتان يدفعان جميعاً في الاتجاه نحو التبويب/ الفهرسة القوية (عنونة 
بوسم مميز وتحديد للهوية) (2005 طخطء)13 220 ء10008): وتعد صور الاستشعار 
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عن بُعد مثالاً على تعزيز الدقة, ففي أواخر الثمانينيات كانت أعلى دقة للصور المتاحة 
لمعظم الباحثين غير الحكوميين عن سطح الأرض هي لتلك الصور التي التقطتها أقمار 
لاندسات (5عغ111ع526 21 ]) الصناعية. حيث تمثل كل نقطة ضوئية (بكسل) قطعة 
من الأرض تقدرء ماع ١‏ متراء في حين أن الكثير من الصور المتاحة على جوجل إيرث 
ذات دقة تصل إلى 75,0 < 0,؟ مترء مما يتيح عرض امزيد من التفاصيل وتحليلها. 
وبا مثلء فيما يتعلق بمخرجات بيانات التعداد السكانيء فقد زاد علو درجة البيانات 
في العديد من الدول. ففي الحالة الأيرلندية» كان نشر بيانات التعداد حتى وقت 
قريب للدوائر الانتخابية ( ١,20‏ منطقة بمتوسط ١,0٠‏ نسمة في كل منهاء حيث 
كانت الكثافة السكانية لكل دائرة انتخابية أعلى بكثير في المدن والبلدات وأقل في 
المناطق الريفية). وفي العام .5١0١١‏ تم وضع بيانات التعداد بتوزيع جغرافي جديد سمي 
بالتجمعات الصغيرة: التي بلغ عددها 18,5/8/8. تمثل الوحدات الجديدة بالعادة بيانات من 
١080-٠‏ من الأسر (2009 .21 أ» دهوء»61). وقد أتاحت التحجمعات الصغيرة إجراء تحليل 
التعداد على مستوى الحي أو الغارغ بدلا من فساحات شاسبعة عدا ومناطق ذاث 
أعداد متساوية ييل من السكان التي يمكن مقارنتهاء مما 52505 أكبر للتجمعات 
السكانية والاقتصاد الأيرلندي. وإمعانا في تحرّي المزيد من الدقة, يجمع العديد من 
وكلاء / سماسرة البيانات كميات كبيرة من البيانات المتعلقة بالأفراد والأسر التي تمكن 
الشركات من استهدافهم بشكل فردي بالسلع والخدمات (انظر الفصل الثاني). 
وقد صاحبت الزيادة في دقة البيانات» الزيادة في تحديد الهويات للأشخاص. والمنتجات, 
والمعاملات. والأقاليم شيك أصحظ بباناقيا أكثر شوو وقورة :يظريهتيا (انظر الفصل 
الخامس). فعلى سبيل المثالء» تحمل معظم السلع ا معروضة للبيع في متاجر التجزئة الكبرى 
في الوقت الحاضر الرمز الشريطي (الباركود)» ويميّز هذا الرمز المنتج» ولكن ليس كل وحدة 
منه على حدة - حيث تشترك كل زجاجات صابون شعر الرأس (الشامبو) من نفس العلامة 
التجارية (الماركة) في نفس الرمز - مما يعني أنه لا يمكن التمييز بينها بشكل فردي. 
وفي المقابل» تتميز زجاجة صابون شعر الرأس الموسومة بشريحة تحديد الهوية باستخدام 
موجات الراديو ((1آ1181 -عع1ع0آ1 مكدع تادمع11 تإعءمعناوء:8 12016) بشكل فريد. 
لأن لكل شريحة رمز فريد من الممكن قراءته عن بعد بواسطة جهاز استشعار الذبذبات 
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الراديوي. ونتيجة لذلكه يمكن تتبع كل زجاجة من مكان صنعها من خلال سلسلة التوريد 
وحتى المتجر وسلة العميلء مما يوجد مسار للتدقيق المفصل. وبعبارة أخرىء فقد أصبح 
من الممكن تتبّع الأمور الفردية بدقة عبر الزمان والمكان. بما في ذلك أولئك الذين يعملون 
على نقل أشياء من مكان لآخر. وبالمثل: بالنسبة للمعلومات. وخاصة تلك التي في شكل 
رقميء حيث يتم تعريفها بشكل فريد من خلال رموز إدارة الحقوق الرقمية (1هاذع:2 
212128224 45طا1118). فعلى سبيل المثالء يمكن تعيين معرفات الكائن الرقمي (1018162[1 
8 -116261615 أءء زط 0) إلى الأعمال الإبداعية المتوفرة على الإنترنت (كالتقارير 
المجلات, الصور. الصوت. وملفات الفيديو). فمعرفات الكائن الرقمي هي محدد هوية دائم 
مرتبط بالبيانات الوصفية. مثل عنوان الإنترنت (:آ1718] -1م0أ2ه0.:آ عع1تاموع1 21وناء كنمنا) 
الذي يشير إلى موقع الملف. ويعزز استخدام المعرّفات الفريدة العلائقية والقدرة على ربط 
وضم البيانات معاء كما يوفر وسائل عملية لفرز ورصد ومطابقة وتمثيل الكائنات (دمترآ 
5 تنه ط12© :2005 صنطء ]1 0د عع12008 :20035؛ انظر أدقا الفصل العاشر). 


العلائقية (جانلهصه 126 1): 

تتمثل العلائقية بمدى القدرة على ضمْ مجموعات بيانات مختلفة بروابط بعضها مع 
بعض وكيف يمكن استخدام هذه الروابط للإجابة عن أسئلة جديدة. فالعلائقية هي 
في صميم قواعد البيانات العلائقية (انظر الفصلين الثاني والخامس). وهي القدرة على 
إنشاء بيانات غاية في العلائقية التي تدفع بسوق البيانات الواسع وأرباح وكلاء البيانات 
وشركات الملفات التعريفية (انظر الفصل الثاني). إن الدرجة العالية من العلائقية هي 
ماامضخل الفعداك النسكاق مفيدا جدا لفهم الركينة السكائية لأي آمك وكيق تخي عير 
الزمان والمكان. وتختلف دراسات البيانات الصغيرة في مدى علائقيتهاء أي ميل تلك التي 
تنطوي على البيانات ا منظمة لدرجات أعلى من الترابط من تلك البيانات غير المنظمة, 
وهذا يستدعي القول إنه ينبغي وجود شكل من أشكال العلائقية بين البيانات لاستخلاص 
التفسيرات والاستنتاجات الشاملة منها. 

وعلى الرغم من أن البيانات الكبيرة لا تستخدم غالبا بنية قاعدة بيانات علائقية 
(انظر الفصل الخامس). فإن ميزة أساسية في طبيعتها هي العلائقية القوية. وكما فصّل 
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(2 :2011) 571010ةةن تنه 607:0 فإن «البيانات الكبيرة مترابطة بشكل أساسيء وتنبع 
قيمتها من الأنماط التي يمكن استخلاصها من خلال صنع روابط بين أجزاء من البيانات 
عن فرد. أو أفراد على علاقة بآخرينء أو مجموعات من الناسء أو ببساطة عن هيكل 
تنظيم المعلومات نفسها». إلا أنها وخلافاً لقواعد البيانات العلائقية» فهي تتقن بالتساوي 
التعامل مع البيانات غير الرقمية (الرمزية)» والبيانات غير المنظمة كما البيانات المنظمة, 
والربط بين النوعين معاً وتعظيم القيمة المستفادة من التقاطعات بينها. ومن ثم, أصبح 
من الممكن الربط بين مجموعات متنوعة من البيانات - الشخصية والعملية: والتفاعلية, 
والاجتماعية:. والمالية» والمكانية» والزمنية» ...إلخ - وتحليلها على أساس فردي وجماعي 
للعلاقات والأماط. 

وقد ثبت جلي كمثال على قوة هذه العلائقية, الاامتخدام المكثف للبيانات الكبيرة في 
الحملات الانتخابية للرئيس الأمريكي أوباما في العام 8١٠٠م‏ و17١1١7م.‏ فعلى النحو الذي 
فصّله (2012) ع1ءطم»1556. سعى فريق أوياما لتحديد وتتبع جميع جوانب حملاتهم 
الانتخابية في 7٠١8‏ م و17١7‏ م. ووضع سلسلة كاملة من المقايبس التي تم تسجيلها 
والتنقيب فيها بشكل مستمر للحصول على معلومات,. وأنماط واتجاهات مفيدة. واشتمل 
ذلك على مراقبة صارمة للإجراءات الخاصة بهمء مثل وضع الإعلانات عبر وسائل الإعلام 
المختلفة.» وإجراء حملات بريد الإلكترونية. والاتصال الهاتفي بالناخبين المحتملينء وطرق 
الأبواب وفرز الاصوات الانتخابية للمناطق» وتنظيم الاجتماعات والمسيراتء وتتبع الذين 
كانوا قد تحدثوا إليهم وماذا قالوا أو ما التزموا به. وقد عرّزوا هذه المعلومات بمئات 
التجارب العشوائية واسعة النطاق المصمّمة لاختبار فعالية مختلف طرق إقناع الناس على 
التصويت لصالح أوباما أو التبرع بالأموال لحملته. وجمع فريق أوباما بين جميع المعلومات 
التي نتجت فيما تعلق بالناخبين وبيانات التسجيلء والتعداد السكانيء والبيانات الحكومية 
الأخرى. ومسوحات الاقتراع» وبيانات جرى شراؤها من طيف واسع من الموردينء جما في 
ذلك وسطء البيانات ووكالات التصنيف الائتمانيء وشركات التلفاز الخطي (157' 00516). 
وكانت النتيجة مجموعة من قواعد البيانات الضخمة عن كل الناخبين في البلاد تتكون مما 
ل ايقل عن ثمانين من المتغيرات (2012 02912 ). وأكثر من ذلك أنها ترتبط بالخصائص 
الدموغرافية للناخبين المحتملينء وتاريخ انتخابهم» وكل حالة من حالات تواصلهم مع 


1 ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة» والبنى التحتية للبيانات, والنتائج المترتبة عنها 


البيانات الكبيرة 


حملة أوباما وردود أفعالهم» والتاريخ الاجتماعي والاقتصاديء وأنماط سلوكهم واستهلاكهم, 
ووجهات النظر والآراء التي تم الإعراب عنهاء مع تحديث قواعد البيانات يومياً خلال 
الحملة بكل بيانات جديدة يجري إنتاجها أو شراؤها. إما في الحالات التي لا يعرف فيها 
محللو أوباما الانتماء السياسي للناخبء ولا يمكنهم فيها الوصول إلى ذلك من خلال الاتصال 
المباشر معه. فإنهم يوظفون خوارزمية متطورة تستخدم المتغيرات التي بحوزتهم عن 
شخص ما للتنبؤ عن التصويت المحتمل المفضل له (2012 ع:ءطم»185). وكانت النتيجة 
مليارات من أجزاء البيانات المترابطة والتي استخدمت للتعريف بالناخبين بشكل فرديء 
وتقييم مدى احتمالية قيامهم بالتصويت والكيفية التي يصوتون بهاء والكيفية التي قد 
يستجيبون بها مختلف السياسات والقصص. لقد أنشاً الترابط بين البيانات في حملة 
أوباما ما اصطلح عليه (2012 .21 © 605م0822) مصطلح «تأثير تضخيم ال معلومات» 
(أءع111 اع لنامى 12101220). حيث مجموع البيانات أكثر من الأجزاء. 


السرعة (67ك17»10): 

هناك فرق جوهري بين البيانات الصغيرة والبيانات الكبيرة يتمثل في الطبيعة الديناميكية 
لإنتاج البياناتء فالبيانات الصغيرة تتكوّن عادة من الدراسات التي تكون مؤطرة بقالب 
جامد من حيث الزمان والمكان. وحتى في الدراسات المطؤلة» يتم التقاط البيانات في أوقات 
متفرقة ذات فاصل زمني (على سبيل المثال» كل بضعة أشهر أو سنوات). فعلى سبيل المثال» 
يتم إجراء التعدادات السكانية بشكل عام كل خمس أو عشر سنوات. وفي المقابل يتم 
إنشاء البيانات الكبيرة على أسس أكثر استمرارية بكثير. وفي كثير من الحالات بشكل آنٍ أو 
لحظي وبشكل مباشر بالتقارب من الوقت الحقيقي للوقوع (©م:ذ861-1) . وعوضاً عن 
قدر ضئيل ومتفرق من البياناتء التي تجمع أو تعالج بمشقة: فإن البيانات الكبيرة تتدفق 
بسرعة. ولذلك كان هناك انتقال في التعامل من المعالجة بالدفعات (عطزووءعء0»م طء826) 
إلى البيانات المتدفقة (2012 .21 اء 013105م23110) (10262 عوسنصدء5). فمن ناحية., 
يسهم هذا في مسألة كبر حجم البيانات من خلال إنتاج بيانات بسرعة أكبرء ومن ناحية 
أخرىء فهو يجعل كامل دورة البيانات أكثر ديناميكية بكثير ويبرز قضايا كيفية إدارة نظام 
البيانات المتغير باستمرار. 
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وتنبع السرعة من التكرار المستمر لتسجيل ال مشاهدات مع مرور الوقت و/أو تغيّر 
المكان (2009 5طامع12) مع كون العديد من الأنظمة في وضع التشغيل الدائم باستمرار 
(2005 طنطءغ4؟1 0ه ءعع12008). فعلى سبيل المثال. تسجل امواقع الإلكترونية بيانات كافة 
الزيارات التي تمت للموقع والأنشطة التي قام بها الزائر خلال تصفحه على الموقع؛ كما 
تقوم المعدات الطبية بمراقبة العلامات الحيوية باستمرارء وتسجل الكيفية التي يستجيب 
بها الجسم للعلاج وتثطلق إنذاراً في حال تجاوزت هذه العلامات حدّ معين؛ وتتعقب شركات 
الهاتف ا محمول موقع, وهوية. وطبيعة استخدام الأجهزة ا موصولة على شبكاتها كل بضع 
ثوان؛ وبا مثل ترصد شبكات استشعار الطقس مؤشرات الغلاف الجوي كل بضع دقائق 
وترسل نتائجها إلى قاعدة بيانات مركزية لإدراجها في الاسمتطلاعات الجوية؛ ويسجل جهاز 
استشعار الذبذبات الراديوي (13250020617) على طول طرق امدينة البرية والسكك 
الحديدية هوية الحافلات والقطارات التي تمرٌء مما يتيح لسلطة النقل العام معرفة أماكن 
مركباتها في أي وقت. واحتساب الوقت المقدّر للوصول في محطات التوقف ال مختلفة؛ كما 
تراقب متاجر التجزئة مبيعات آلاف المنتجات المختلفة للآلاف من العملاءء حيث تستخدم 
البيانات لمعرفة أوقات إعادة تعبئة الرفوف وطلب دفعات حديدة من الموردين؛ ويتواصل 
الناس بعضهم مع بعض من خلال مواقع وسائل التواصل الاجتماعي في سيل لا ينتهي 
من التبادلات والعلاقات البينية المتشابكة؛ ويرصد المرقاب (عم0ء161©5) باستمرار السماء 
لقياس التقلبات في موجات الراديو من أجل فهم أفضل لطبيعة الكونء ففي كل هذه 
الحالات» هناك تيار مستمر من البيانات التي تتطلب إدارة وتحليلاً مستمرا. 

ويشكل نقل وإدارة كميات كبيرة من البيانات المنتجة باستمرار تحدياً تقنياً بسبب 
التحديات الناشئة عن محدودية قدرة سعة التخزين مما يوجد اختناقات بشكل سريع 
في حركة مرور وتبادل البيانات. على سبيل المثال. وكما أن فيديوهات موقع اليوتيوب 
(©15ا'تاملا) قد تتوقف أو يتأخر عرضها بسبب كون سعة قناة الاتصال بالإنترنت ليست 
كافية لتواكب سرعة تدفق البيانات ال لمطلوبء فإن الأثر نفسه ممكن أن يقع في حالة جمع 
ومعالجة البيانات. حيث تكون الأنظمة عاجزة عن مواكبة تدفق البيانات. وتشمل حلول 
هذه المشكلة زيادة سعة قناة الاتصال. وتوظيف تقنيات فرز وضغط البيانات مما يقلل 
من حجمها ومن ثم وقت معالجتهاء وتحسين كفاءة خوارزميات ال معالجة وتقنيات إدارة 
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البيانات. كما مَثّل تحليل سيل البيانات المتدفقة تحدياً أيضاًء لأن النظام لا يسكن في أي 
لحظة وعند أي نقطة, كما في حالات الأسواق الماليةء حيث يمكن أن يكون تحليل الصفقات 
لمايكرو ثانية من الزمن قيّماً للغاية. وهناء تستخدم خوارزميات معقّدة. إلى جانب العرض 
امري للبيانات الديناميكية وهي في حالة تغير مستمر, لتتبع وتقييم النظام. 


التنوع (7ا17221): 

قد تختلف البيانات الصغيرة والبيانات الكبيرة في طبيعتهاء كونها منظمة: أو غير منظمة, 
أو شبه منظمة: وتتألف من الأرقام, النصوصء الصور. الفيديوء وغيرها من أنواع البيانات 
الأخرى. إلا أن هذه الأنواع المختلفة من البيانات يرجح أن تكون في البيانات الكبيرة أكثر 
قابلية للجمع والربط بينهاء وإمكانية وصل البيانات المنظمة بالبيانات غير المنظمة. فعلى 
سبيل المثال» تتألف نشرات الفيسبوك من النصوص التي ترتبط في الغالب بصور أو ملفات 
فيديو أو غيرها من المواقع» وهي تجتذب تعليقات مستخدمي الفيسبوك الآخرين؛ كما 
قد تجمع شركة ما بين البيانات المالية المتعلقة با مبيعات واستطلاعات العملاء التي تعبر 
عن مدى ثقتهم بالمنتج» وفي المقابل تكون البيانات الصغيرة أكثر انفصالاً وترتبط» على 
كل حالء من خلال مفاتيح تعريفية وحقول بيانات مشتركة. ويتمثل السبق الأساسي 
بالنسبة للبيانات الكبيرة في كيفية اختلافها عن الأشكال التي سبقتها لإدارة البيانات الرقمية, 
والتي كانت احترافية للغاية في معالجة وتخزين البيانات الرقمية باستخدام قواعد البيانات 
العلاتقية, مما مكن من إجراء مختلف أنواع التحليل الإحصاي. إلا أنها كانت أضعف بكثير 
في التعامل مع نماذج البيانات الغير رقمية. عدا عن مجرد تخزينها في ملفات مجردة أو 
مضغوطة. وكما لاحظ اتحاد مراكز البيانات المفتوحة (2012:7) 12226 [الل نتءغخمعءن 1028 
بأنه في السابق كان يجري تجاهل البيانات غير المنظمة: أو في أحسن الأحوالء استخدامها 
بشكل يفتقر إلى الكفاءة. ومع ذلكء فإن التقدم الحاصل في الحوسبة الموزعة. وتصميم 
قواعد البيانات باستخدام هياكل عوضاً عن لغات الاستعلام الهيكلية (:20050[1) (انظر 
الفصل الخامس». والتنقيب في البيانات وتقنيات اكتشاف المعرفة (انظر الفصل السادس). 
قد زادت بشكل كبير القدرة على إدارة ومعالجة واستخراج ال معلومات من البيانات غير 
ا منظمة. وفي الواقع. يجري على نطاق واسع تداول أن ما يقارب ثمانين في المائة من جميع 
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الفصل الرابع 


البيانات الكبيرة هي غير منظمة بطبيعتها. وكما أبان (2011) وعمنل). فقد أصبح هذا 
الرقم مسلّماً به مع قليل من الإثبات. 


المرونة (واتلتطت»81): 

يكون تصميم البحث وإدارة البيانات مع مشاريع البيانات الصغيرة, غير مرن نسبياً 
بمجرد بدء العمل ال ميداني والتحليلء وذلك بالنظر إلى الخدمات اللوجستية» والتكاليف» 
والحاجة إلى التمثيل في عينة صغيرة الحجم. فعلى سبيل المثال. فإنه من الضروري على كل 
شخص تم جمع بيانات التعداد له تعبئة النموذج ذاته للتأكد من إمكانية قابلية مقارنة 
البيانات عبر كافة السكان. وبمجرد طباعة النماذج, لا يمكن إضافة حقول بيانات جديدة, 
مما يعني ثبات البيانات الممكن استخراجها من هذه النماذج؛ وبالمثل تميل قواعد البيانات 
العلائقية التي تحفظ بها البيانات إلى أن تكون قالبا ثابتا ومحدودة النطاق. وعلى نحو 
مماثلء يكون تصميم البحث عادة: في التجارب العلمية والدراسات البيئية» غير مرن بمجرد 
بدئهاء وذلك بهدف تمكين إجراء عمليات المقارنة والتكرار. أما في الدراسات التي تعتمد 
المقابلات أو الأنشطة الاجتماعية, فمن الممكن للباحثء على الرغم من ذلكء أن يكون أكثر 
مرونة في النهج المتبع. وأن يكون لديه نموذج حرٌ من الأسئلة وإمكانية التكيف مع الأوضاع 
ا مستجدة. وممكن أن يكون ترميز وإدارة وتحليل هذه البيانات هونا 07 ولكن هذا يعود 
جزثياً إلى محدودية حجم ونطاق مجموعة البيانات. 

في المقابلء تم تصميم نظم البيانات الكبيرة لتكون مرنة بطبيعتهاء بحيث تحمل 
سمات قابلية الاستطالة والتفرع (يمكن إضافة حقول بيانات جديدة بسهولة) وقابلية 
التوسع (يممكن التوسع بسرعة) بغض النظر عن الحجم (2012 حتعسهة11ا له جتعد/3). 
ويعني استخدام قواعد البيانات غير الهيكلية للاستعلام :1 71050) إمكانية إدارة البيانات 
ا لمتغيرة بسرعة عالية:؛ والتكيف مع حقول البيانات الجديدة (انظر الفصل الخامس)» 
وهذا يعني أنه من الممكن التكيّف مع إنتاج البيانات على أسس تدويرية:» وأداء الاختبار 
على التكيف. فعلى سبيل المثالء تقوم شركات جوجلء والفيسبوكء ومنصات أخرى 
على الإنترنت بتعديل تصاميمهاء وجمع بيانات حول كيفية استجابة المستخدمين لهذه 
التغييرات على سبيل المثالء مراقبة الزيارات العابرة للموقع, وتحليل النتائج واستخدامها 
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البيانات الكبيرة 


لتقديم مزيد من التعديلات المحسنة للتصميم بغية تشجيع إجراءات وردود معينة 
بشكل مستمر. ولأن أعداد الأشخاص الذين يستخدمون هذه المواقع هائلة. وأحجام 
العينات الخاصة بهم كبيرة جداً فهذا يعني أن بإمكانهم إجراء التغييرات دون الخوف 
من فقدان التمثيل. على سبيل المثالء وبالعودة إلى حملة باراك أوباما الانتخابية, 
فقد أجرى فريق حملته تجارب متتالية عن مدى فعالية التعديلات المحسنة لموقع 
الحملة (12مء.82131202122) لزيادة المشاركة. والعمل التطوعي» والتبرعات. فأحد 
الاختبارات قيّم آثار التغيير على زر «اشترك» إلى «مزيد من ال معلومات». و «انضم إلينا 
الآن». و«اشترك الآن»: وأصبح من الواضح على مدى ثلامائة ألف زيارة أن استخدام زر 
«انضم إلينا الآن» قد أدى إلى عشرين في المائة زيادة في الزائرين المقبلين على التسجيل 
في الموقع (2012 وهأ ططء155). 

فمثل هذه المواقع الكبيرة الحجم ينبغي أن تكون أيضاً قابلة للتوسع والتطويرء 
وقادرة على التعامل مع الطفرات الناشئة في طلب وإنتاج البيانات. حيث يتسبب مقدار 
حركة مرور البيانات في انهيار قاعدة البيانات العلائقية التقليدية العاملة على خادم 
واحد. فعلى سبيل المثالء يمكن أن يزداد عدد التغريدات التي يتعامل معها تطبيق 
التواصل الاجتماعي تويتر بشكل ملحوظهء مع عشرات الآلاف من التغريدات التي يجري 
نشرها كل بضع ثوان أثناء الأحداث الكبيرة. مثل حفل افتتاح الألعاب الأوطبية أو خلال 
امباراة النهائية. وكان الحل هو تركيب أنظمة عتاد تتألف من أجزاء موزعة بحيث تخزن 
البيانات في قواعد بيانات مقشّمة عبر العديد من الخوادم: مما يمكن من توسيع نطاق 
التخزين بحسب الحاجة. وعلاوة على ذلك. ففي بعض الأنظمة, مثل تويترء يمكن تعيين 
المرونة من قبل المستخدمين لتحديد ما إذا كانت تشمل البيانات أم لا. على سبيل المثال» 
يقرر المستخدمون في العديد من تطبيقات وسائل التواصل الاجتماعي والمتنقلة إدراج 
أو عدم إدراج مواقعهمء وكذلك البيانات التعريفية الرئيسية الأخرى المتعلقة بالهوية 
(2013 لتتهصمطهي). 
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الخلاصة: 

البيانات الكبيرة هي ظاهرة حديثة, لسر إلى التطبيق والانتشرر المتسارعين لهاء فقد 
يرك تقاقنات ممديرة هول ما يشكل النانات الكبيرة والحصاكض اللرفطة ريا وين 
بعض التعاريفء مثل تلك التي تنص على أن البيانات الكبيرة هي أي مجموعة بيانات 
كبيرة جداً بالقدر الذي لا يمكن معه تخزينها في جدول بيانات إكسل أو على جهاز واحد 
(2012 56:02).: مبتذلة للغاية وغير مفيدة.ء حيث تخفض مستوى مفهوم البيانات الكبيرة 
إلى خاصية الحجم فقط. لقد أصبح من الواضح أن لدى البيانات الكبيرة عدد من الخصائص 
الملازمة لها والتي تجعلها مختلفة نوعيا عن الأشكال السابقة من البيانات» وتم في هذا 
الفصل مناقشة الخصائص الأساسية السبعة للبيانات الكبيرة: الحجم, والسرعة, والتنوع, 
والشمولء والدقة / الفهرسة, والعلائقية» والمرونة / قابلية التوسع التي تميزها عن البيانات 
الصغيرة (انظر الحدول .)١١7‏ 


فهذه هي دورة المستوى الأول فيما يتعلق بتقديم تقييم توصيفي لطبيعة البيانات 
الكبيرة. وهناك حاجة إلى مزيد من العمل لتقييم البيانات الكبيرة الناتجة عن مصادر 
متعددة لتحديد ما إذا كان هناك أصناف متنوعة في طبيعة البيانات الكبيرة. فعلى سبيل 
المثال» قد تحمل بعض البيانات خمساً أو ستاً من هذه الخصائصء ولكنها لا تستوفي أو 
ضعيفة في واحدة أو اثنتين» وقد تفتقر مجموعة بيانات إلى التنوع (منظمة بشكل كبير)» أو 
الحجم (صغيرة, ولكن شاملة مع حجم العينة ن - الجميع»» أو قليلة السرعة (يتم إنشاء 
البيانات بانتظام ولكن في كل شهر عوضاً أن تكون بشكل مستمر)» أو تفتقر إلى الفهرسة 
(كونها مجهولة المصدر أو مجمعة). مع حملها للخصائص الأخرى على سبيل المثال. فمن 
الواضح أن مثل هذه البيانات ليست بيانات صغيرة كما هو مبيّن في الفصل الثاني ولكنها 
في ذات الوقت ليست بيانات كبيرة كما تفهم بمعناها الضيق الذي يصفها بكل الخصائص 
السبع» ولكن يمكن اعتبارها على الرغم من ذلك شكلاً من أشكل البيانات الكبيرة. وبعبارة 
أخرىء هناك حاجة لإنتاج تصنيف للبيانات الكبيرة قائم على أدلة تجريبية قوية مع أمثلة 
الحالات التي من شأنها أن تساعدنا على التفكير بصورة أكبر في طبيعة هذه البيانات. 
ويحتاج هذا إلى أن يكون مصحوباً بدراسة للخصائص الأخرىء مثل نوعية البيانات وصحتهاء 
ودقتهاء ومنشئها (انظر الفصل التاسع). 
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كما تثير الخصائص السبع للبيانات الكبيرة تساؤلات بشأن الآثار المترتبة على طوفان 
مثل هذه البيانات: وما الذي يعنيه القدرة على الوضول إلى بيانات كبيرة جداء وشاملة. 
ومتغيرة. ودقيقة. ومفهرسه. ومتنوعة. وعلائقية» ومرنة» وقابلة للتوسع بالنسبة للمجتمع 
والحكومة ورجال الأعمال؟ وإلى أي مدى يمكن أن توفر هذه البيانات رؤى ثاقبة عن 
حالة الإنسان أو المساعدة على تناول بعض القضايا الاجتماعية: والسياسية: والاقتصادية, 
والبيئية الأكثر إلحاحاً والتي تواجه كوكب الأرض؟ أوء بدلاً من خدمة الصالح العامء فهل 
ستستخدم هذه البيانات لمزيد من خدمة المصالح الخاصة في الغالب؟ أو خدمة مصالح 
الدولة؟ وكيف سوف تغير هذه البيانات في نظرية ا لمعرفة العلمية في جميع المجالات 
(الآداب والعلوم الإنسانية, والعلوم الاجتماعية» والعلوم الفيزيائية والحياتية» والهندسة)؟ 
فالفصل السابع والثامن والعاشر ستناقش هذه القضايا بالتفصيلء وتقدم التفكير النقدي 
لآثار وعواقب البيانات الكبيرة. 
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الفصل الخامس 


ممكنات البيانات الكبيرة ومصادرها 


برز النمو السريع للبيانات الكبيرة نتيجة التطور المتزامن معه لعدد من التقنيات المساعدة, 
والبنى التحتية: والأساليب وال ممارسات. وتضمينها بشكل سريع في الأعمال اليومية: وا ممارسات» 
والمساحات الاجتماعية. وتضمنت هذه البنية التحتية ا معرفية الجديدة إطلاق طيف واسع 
من مجموعة متنوعة من تقنيات ا معلومات والاتصالات. وخاصة خدمة الإنترنت الثابتة 
والمتنقلة عبر الهاتف المحمول؛ وإدخال البرمجيات في جميع الكائنات, والآلات والأنظمة: ناقلة 
إِيَاها من «الغباء» إلى «الذكاء». فضلاً عن إنشاء أجهزة وأنظمة رقمية بحتة بالكامل؛ وتطوير 
الحوسبة الشمولية الواسعة الانتشار والقدرة على الوصول إلى الشبكات والحوسبة في العديد 
من البيئات» وعلى ذات خطى هذا التحرك؛ التقدم في تصميم قواعد البيانات ونظم إدارة 
المععلومات؛ وعروض التخزين الموزع والتخزين الأبدي للبيانات بأسعار معقولة؛ والأشكال 
الجديدة من عطيلات الببانات المعممة للسامل مع وفرة اليافات يذلا من قدرقها. 

وإضافة إلى تمكين الوصول والمشاركة والتخزين للبيانات» تعد البنية التحتية وا معرفية 
الجديدة في الغالب الوسيلة التي يتم إنتاج الكثير من البيانات الكبيرة منها. ففي الواقع, 
وبلا شك أن الحالة في وقتنا الحاضر تتمثل في أننا نعيش في مجتمعات تستخدم على نحو 
متزايد تقنيات البيانات المكثفة وامنتجة لها وتنتظم على أساسها. كما أصبحت الممارسات 
الشخصية في الاتصالء والاستهلاكء والإنتاج» والسفرء والحياة المنزلية: أكثر فأكثر تتوسّطها 
الأجهزة الرقمية التي تنتج الكثير من البيانات المستنفذة القيّمة. وعلاوة على ذلك يتم 
الآن مراقبة وتنظيم الأماكن التي نعيش فيها على نحو متزايد بمجاميع كثيفة من التقنيات 
والبنى التحتية المدغمة بالبيانات» مثل أنظمة المرور وإدارة الطباني» ونظم المراقبة والشرطة, 
وقواعد البيانات الحكومية, وإدارة العملاء وسلاسل الدعم اللوجستية» والأنظمة اطالية 
ونظم المدفوعات. وستناقش العوامل المساعدة ومصادر البيانات الكبيرة بالتفصيل في هذا 
الفصل. 
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الفصل الخامس 


العوامل المساعدة للبيانات الكبيرة: 

تعد البيانات الكبيرة مُحصلة للتطور والتقارب بين مجموعة متقدمة من التقنيات في 
مجال الحوسبة منذ نهاية الحرب العابلية الثانية. ويشمل ذلك إنتاج أجهزة الحاسب 
المركزية في الخمسينيات والستينيات؛ وشبكات الإنترنت الوليدة في السبعينيات والثمانينيات 
التي ربطت الحاسبات بعضها ببعض؛ والانتشار الواسع النطاق للحاسبات الشخصية في 
الثمانينيات والتسعينيات؛ والنمو الهائل للإنترنت في التسعينيات. وتطوير الصناعات القائمة 
على الويبء جنباً إلى جنب مع النمو الهائل في الهواتف النقالة والأجهزة الرقمية مثل أجهزة 
الألعاب والكاميرات الرقمية؛ وتطوير الحوسبة السحابية, والموزعة:. والنقالة, وتقنيات 
الإصدار الثاني لشبكة الويب (2.0 ط186) في بدايات الألفية الثانية؛ وتفشي الحوسبة الشمولية 
واسعة الانتشار (1101185م00122) 21725316 3120 171011160115) خلال هذا العقد. وخلال 
هذه الفترة وقع عدد من المؤثرات التحويلية» فزادت القدرة الحاسوبية أضعافاً مضاعفة, 
وتم ربط الأجهزة معاء وتداخلت الأنظمة الرقمية بازدياد متعاظم في شئون الحياة اليومية 
وعملياتهاء وأصبحت البيانات أكثر من أي وقت مضى مفهرسة وقابلة للقراءة الآلية» كما 
توسعت أنظمة تخزين البيانات وأصبحت موزعة. 


الحوسبة (116261011 مده ): 

بينما قدّمت الحواسيب الرقمية المركزية الأولية في الخمسينيات والستينيات قدرة 
حاسوبية أكثر كفاءة من تلك التي عند البشر والأجهزة التناظرية التي استخدموها (مثل 
المعداد, والآلات الحاسبة اطيكانيكية؛ والآلات الحاسبة بالبطاقات امثقوبة. وأجهزة 
الحاسب التناظرية. إلخ). إلا أن قوة المعالجة لها كانت محدودة: ومن ثم كانت أنواع 
العمليات التي يمكن أداؤها مقيدة. وعلاوة على ذلك كانت تلك الحواسيب كبيرة الحجم 
ومكلفة. على سبيل امثال. كان بإمكان حاسب الإينياك (1هع1اء تصتاط عنصمناءع181 
نعشالاظ -اع اا محطهن له اعدو[ مخ 1م خهمرعء1): الذي 0 ف منتصف الأربعينيات, 
أداء خمسة آلاف عملية جمع وطرح في الثانية. ولكن اقتصرت ذاكرته الرئيسية عالية 
السرعة على عشرين كلمة (أي ثمانين بايت). لآلة تزن ثلاثين طناء وتحتوي 1/٠٠٠‏ 
أنبون فراغيء و١٠0٠,10‏ مرخلء ومئات الآلاف من المقاومات والمكثفات والمحاثات, 
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وباستخدام مائتي كيلوواط من الطاقة الكهربائية (2004 نصرزه1<). وفي العام 1956م, 
توقع 1001 0105© من إنتل بأن يتضاعف عدد التراننستورات في الدوائر المتكاملة 
كل ثمانية عشر شهراً في العقد المقبل ذلك الحينء مما يزيد بشكل كبير القدرة الحاسوبية 
(وهو ما أصبح يُعرف لاحقاً باسم قانون مور). وقد أثبت هذا التوقع بصيرة نافذة حيث 
تم إدخال تحسينات تقنية على مكونات وتصميم أجهزة الحاسب (من خلال الانتقال 
من الأنابيب الفراغية إلى الترانزستورات إلى الدوائر المتكاملة إلى العالجات اللصغرة)» 
وازدادت القوة الحسابية فيما يقرب من الخمسين في المائة سنوياً بين عامي 194٠‏ م 
و١١٠٠م‏ (2002 كتاهطل710). وإلى جانب هذا النموء انخفضت تكلفتها بشكل كبيرن 
حيث تشير إحدى التقديرات بانخفاض في تكلفة الحساب ناهز أضعاف الكوادريليون 
)٠٠١٠١0 0٠000.66... )‏ خلال القرن العشرين (2003 054 ). 

استمرت مثل هذه الزيادات الهائلة في القدرة الحاسوبية والانخفاضات الكبيرة في 
التكلفة في الألفية الجديدة, ولكن الأهم من ذلك أنها أصبحت متنقلة على نطاق واسع 
مع انتشار مكثف للأجهزة الحاسوبية المحمولة مثل أجهزة الحاسب المحمولء والأجهزة 
اللوحية والهواتف الذكية, وأجهزة الملاحة المرتبطة بالأقمار الصناعية (53631357).: وغيرها. 
وتعادل قوة ا معالجة للهاتف الذي المتوسط "عشرة أضعاف قوة جهاز الحاسب المركزي 
كراي1- (7-1ز022) الذي تم تشغيله في مختبرات لوس ألاموس الوطنية في عام 1976م " 
(11< :2013 101725620): مع استخدامها جزء من قوة معالجتهاء حيث تمتلك قدرات 
حاسوبية» وتخزينية. وتطبيقات أكثر من العديد من أجهزة الحاسب الشخصية منذ 
عقد واحد فقط من الزمنء وهي أيضاً تشغل جزء بسيط في حجم العتاد المستخدم. 
على سبيل المثال. لدى العديد من الهواتف الذكية معالجا مصغرا بسرعة ١,٠ - ١,0‏ 
غيغاهرتز و١١‏ - "ا غيغابايت من الذاكرة الرئيسية. وتمكن هذه القوة في اللعالجة 
وسعة الذاكرة من معالجة كميات كبيرة جداً من البيانات بسرعة» ليتمٌ تخزينها محلياً 
لأنها متصلة شبكياً ومشتركة. 
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الربط (عسكفاء:هماء81): 

بذات القدر من الأهمية للنمو الكبير في القوة الحسابية لمعالجة البيانات الرقمية كان 
الربط بين الحاسبات بعضها مع بعض والذي سهل نقل وتبادل البيانات فيما بينها. وقد 
وقع أول اتصال شبكي بين جهازي حاسب عبر شبكة الإنترنت في نوفمبر عام 1975 م: وقد تم 
الربط بين نقطة في جامعة كاليفورنيا في لوس أنجيلوس (001:4)) ونقطة أخرى في جامعة 
ستانفورد (1995 52115). ثم نمت الشبكة ببطء. من ١١‏ نقطة في يناير ١/191م,:‏ إلى 71 في 
أبريل 1917م إلى 57 في يونيو 191/6م: و١1١١‏ بحلول مارس /191/1م, واقتصرت حينها على 
متعاقدي وكالة مشاريع البحوث المتطورة الدفاعية (11نء0”251 :1992 .21 أهء تتداط) (خطك1م 
5. وتعمل شبكة الإنترنت من خلال تقطيع البيانات والتعليمات في حزم متساوية 
الحجم ونشرها عبر النظام» مع عنونة كل حزمة بمعرف وعنوان المرسل إليه ا مطلوب, ثم 
تمرّر كل حزمة من نقطة اتصال إلى أخرى إلى أن تصل إلى الوجهة المقصودة حيث يتم إعادة 
تجميعها هناك. ولتمكين اتصال الأجهزة والشبكات التي تعمل على سرعات مختلفة على 
مدار الساعة وتستخدم حزماً مختلفة الحجم. اعتمدت مجموعة معيار (بروتوكول) الشبكة 
قي سي بي / آي بي (105/15) (معيار التحكم بالإرسال / بروتوكول الإنترنت) في عام 191/7 
(0”21111995). ولا يزال هذا المعيار يستخدم حتى يومنا هذا. كما يؤكد هذا المعيار على 
حيادية الشبكة, حيث يتم التعامل مع كافة البيانات على قدم المساواة ودون تمييز بينها أو 
تفاضل في التكلفة (2011 18). 

وبحلول أواخر السبعينيات» تمّ إنشاء الشبكات ال محلية الداخلية» كما تم إنشاء الشبكات 
الأخرى دوليا وتم ربطها بشبكة الإنترنت الوليدة» إضافة إلى شبكات الهواة المستقلين 
والشركات», كما أصبح من الممكن إرسال حزم البيانات عبر الأقمار الصناعية. وبالإضافة إلى 
نقل البيانات وا ملفات, تم إنشاء البريد الإلكتروني واللوحات الإعلانية (1998 صنطاء)18). 
وخلال الثمانينيات: تنث البنية التحدية: مع لاعبين جدد هن اللؤسسات والشركات: جنباً إلى 
جنب مع تطور شبكات الإنترانت الداخلية (الشبكات الخاصة). وفي عام 1957م اخترع تيم 
بيرنرز لي (عع51215-1 حطذ1) من سيرن (0181821) في حنيف الشبكة العامطية (الويب). 
وقدّم وسيلة سهلة الاستعمال أكثر بكثير للوصول إلى الإنترنت واستخدامها. وخلال 
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التسعينيات وبدايات الألفية الجديدة: تم تطوير تقنيات شبكية جديدة مثل شبكات اتصال 
اميدان القريب (8]1)0) والتواصل المباشر (7122112126105طهب عه مستدمءرط) باستخدام 
معايير البلوتوث. والتغطية المحلية اللاسلكية الواي فاي (107151). والشبكات الوطنية 
للاتصالات المتنقلة (6581/36). ووفقاً لقوانين جورج غيلدر (2000) (1146© عجرم ©) 
في الاتصالات. فإن إمدادات العام من عرض النطاق الترددي (قدرتها على نقل البيانات) 
تتضاعف كل ستة أشهرء مع مزيد من القدرة الإضافية التي تقدّمها الشبكات اللاسلكية. 
ونتيجة لهذه التطورات: فقد أصبح الربط متاحاً بين الأجهزة الحاسوبية من خلال شبكة 
الإنترنت بشكل أسهل على نحو متزايدء وأسرع وعلى نطاق أوسع. 


الحوسبة الشمولية واسعة الانتشار: 

صاحب التوسع في النفاذية وقدرة الوصول إلى شبكات تقنية المعلومات والاتصالات 
وزيادة سعات قنوات الاتصال (عرض النطاق الترددي). تنوّع وتوسّعٌ في الأجهزة الرقمية 
والتي تتصل إما بشكل مباشر أو غير مباشر (حيث يتم تحميلها على جهاز آخر أولا) 
بشبكة الإنترنت لتبادل البياناتء أو التعليمات, أو الحصول على التحديثات البرمجية. 
ففي بعض الحالات حلت التقنيات الرقمية الجديدة محل الأشكال السابقة من البيانات 
التماثلية / التناظرية, فعلى سبيل المثال» تم استبدال أنظمة الهاتف التماثلي بالهواتف 
المحمولة والهواتف الذكية: واستبدلت كاميرات المراقبة التناظرية التي تسجّل على شريط 
فيديو بكاميرات رقمية تلتقط الصور الرقمية.» ويجري الاستعاضة عن الموسيقا ا مخزنة 
على الشريط المغناطيسي أو الفينيل بملفات صوتية رقمية» والنماذج الورقية بأخرى 
إلكترونية على الإنترنت. من هناء تم تحويل الأجهزة والأنظمة التي كانت تعد نسبيا 
«غبية» لتصبح «ذكية» ببعض الطرقء وعادة من خلال استخدام البرامج المرتبطة بها 
(2005 متطءغت]آ مه ع0008). وتعني كلمة «الذكية» هنا بشكل عام بأن الجهاز قد 
تمت برمجته ليكون ذاعيا للطريقة الخاصة التي يستخدم بها وقادراً على اتخاذ قرارات 
مستقلة. وآنية. ومؤتمتة من مجموعة الخيارات المحددة من خلال تطبيق خوارزميات 
على البيانات المنتجة (انظر 20072 «ندءغ1؟1 220 »10008). وخير مثال على تجميع 
تقني «غبي» أصبح على نحو متزايد «ذكي» هو السيارة» فالسيارة الحديثة يتم تحميلها 
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بأجهزة رقمية. ومستشعرات ومحركات. والتي تراقب وتنظم أنظمتها المختلفة وتتداخل 
مع تجربة القيادة (2004 146ط1). ويمكن أن تنتقل البيانات المخزنة من هذه الأجهزة 
عبر شبكات الاتصالات عن بُعد للشركات أو تحميلها من قبل مهندس لإجراء تحليل 
تشخيصي (20072 صنطءغ1! لصد ءع10008). وفي حالات أخرىء هناك أجهزة لا مكافئ 
تناظرياً لهاء حيث تنتج بيانات جديدة كلياً في شكلهاء مثل تلك الناتجة عن أنواع جديدة 
من التقنيات الرقمية, والمسح الضويء وأجهزة الاستشعار على سبيل ال مثال. ماسحات 
التصوير بالرنين المغناطيسي 11111 في مجال الصحة؛ وإضافة إلى جعلها «ذكية»». فإن 
الأنظمة تعمل في الغالب على جمع أكبر قدر من البيانات قدر الإمكان. وتسعي لتكون 
هذه البيانات شاملة وليست انتقائية. وهناء قد يتم جمع بيانات عرضية أو غير ضرورية 
لتوفير الخدمة أو العملية» مثل التفاصيل الشخصية أو الموقع الجغرافي. فغالبا ما تحدد 
الإعدادات الافتراضية للأجهزة بشكل يتيح للناس إمكانية اختيار الانسحاب من أنظمة 
إنتاج البيانات من خلال عقود الاستخدام للبرمجيات والمواقع: مع النص على العقوبات إذا 
اختاروا القيام بذلك. مثل تردي الخدماتء والتكاليف الإضافية, أو حجب الخدمة بالكلية. 

وبالمثلء حصل هذا النمو في الأجهزة الرقمية في ا منزلء وفي الشارع. وفي أماكن العمل 
وعبر شبكات النقلء وفي غيرهاء مما دفع المعلقين للافتراض بأننا قد ولجنا عصر (البرمجيات 
في كل مكان -2006 28610ء67) (ع87711/8). إذنء هذا هو عصر الحوسبة واسعة 
الانتشار في كل مكان. حيث يتم توزيع القدرة الحاسوبية وإتاحتها في كل مكانء مع العديد 
من الأجهزة الحاسوبية التي تعمل لكل شخص (2012 .81 ]© 5هعنهآ). فالحوسبة المنتشرة 
(28تا دهن عكزوه227) هي إضافة للقدرة الحاسوبية وإتاحة الوصول إلى شبكات 
تكنولوجيا المعلومات والاتصالات للكائنات والبيئات اليومية الثابتة لجعلها تفاعلية و«ذكية» 
(2001 1155تد120). وفي المقابل: فإن الحوسبة في كل مكان (1128ام دهن كنام التو 1طن]) 
هي القدرة الحاسوبية التي تتحرك مع الشخص بغض النظر عن البيئة؛ كالأجهزة التي 
يحملها الناس مثل الهواتف الذكية وأجهزة الملاحة عبر الأقمار الصناعية التي تعتمد على 
الوصول إلى شبكات تقنية المعلومات والاتصالات لتقديم الخدمات. وإذا كان شعار الحوسبة 
المنتشرة هو الحوسبة «في كل شيء»». فإن شعار الحوسبة في كل مكان هو الحوسبة «في كل 
مكان»» مع إبراز الحوسبة المنتشرة لعمليات التباعد والتفرع (تضمين البرمجيات في مزيد من 
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الأجهزة) وإظهار الحوسبة في كل مكان لأوجه التقارب (جهاز رقمي واحد للقيام بمزيد من 
المهام) (2011 ءعع12008 هسه صنطء:1؟1). وبينما يلزم الحوسبة المنتشرة أن تكون على إدراك 
موقعي /موضعي (ع21لى 51612102211(7) لتنفيذها بنجاح: تتطلب الحوسبة في كل مكان 
الإدراك ال مستمر للسياق والموقع. 

قابلية الفهرسة والقراءة الآلية (ده ادع قنغصءع 1 11620216 -ع صنطعه]1 لصه لوع هد ل ص1 ): 

على مدى نصف القرن الماضيء أصبحت الظواهر في العالم أكثر وأكثر تحديداً بشكل 
فريد ومن السهولة التقاطها كبيانات. بسبب التقنيات الرقمية وتقنيات العنونة ووضع 
العلامات الجديدة, مما زاد في درجة دقتها وعلائقيتها ومن ثم مستوى التفصيل في تحليلهاء 
بالإضافة إلى تمكين ربط مجموعات بيانات أكثر (انظر الفصل الرابع). فعلى سبيل المثال» 
تتميّز كل الأجهزة الرقمية التي تساهم في الحوسبة المنتشرة والحوسبة في كل مكان بمعرف 
فريد مُفْهْرسء بحيث يعيّن رمز تعريف حصري لكل منها مما يتيح رصدها وتتبّعها على 
الدوام. وعلاوة على ذلك. فإن جميع عناصر إنترنت الأشياء (10'1 -وعصنطآ' 4ه أعصممعغم])ء 
كوكبة واسعة من الأجهزة المتصلة بالشبكة. ا محركات, وأجهزة الاستشعار تنتج بيانات 
مفهرسة مكن تمييزها بشكل فريد (2004 .21 أء 10ءع1معطوءء6). وإضافة لذلكء. فإن 
ا معرفات الفريدة التي تم ربطها بالناس منذ زمن طويلء مثل جوازات السفر.ء والبطاقات 
الصحية. وسجلات التأمينات الاجتماعية. قد جرى تعزيزها من خلال أنظمة تحديد الهوية 
الرقمية والحيوية الجديدة التي تربطها بقواعد بيانات رقمية تتحقق من هويتهم (»10008 
5 طنطءغ؟1 4صه). وهذه تشمل أسماء ال مستخدمين وكلمات السرء وبطاقات السحب 
المغناطيسية. والقارئات الرقمية لبصمة الأصابع» وقزحية العينء والحمض النووي. وفي كل 
حالة. تعد هذه المعرفات ممثابة المصافحة الرقمية» على الرغم من أنها تختلف في مستواها 
من حيث الدقة والثقة. فعلى سبيل المثالء يمكن لأسماء المستخدمين وكلمات المرور أن 
تُسرق أو تزوّر بسهولة؛ في حين أن الحمض النووي هو أصيل وفريد لكل شخص ويحقق 
المعايير الأربعة الأولى من قائمة كلارك (1994 01316) المتعلقة بالخصائص ال مرغوب 
فيها لتحديد هوية الكائن البشري بشكل فعال وهي: شمولية التغطية / النطاق (يجب 
أن يمتلك الجميع الخاصية نفسها)؛ التفرّد (يجب أن يمتلك كل شخص قيمة واحدة فقط 
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لهذه الخاصية: ولا يتساوى فيها أي شخصين)؛ الدوام (يجب أن لا تتغير قيمة الخاصية 
بمرور الزمن» ولا تكون قابلة للتغيير أيضاً)؛ اللزوم (معنى أن تُعد الخاصية صفة طبيعية 
لا يممكن إزالتها ولا غنى عنها). وهذه الصفات تتوافق مع الصفات السبع الأخرى وهي: 
القدرة على التحصيل/ الجمع؛ والقدرة على التخزين؛ والتفرد؛ والدقة؛ والبساطة؛ والتكلفة 
والتناسب؟؛ والقبول. 

وبا لمثلء فإن رموز التحديد المكانية هي أنظمة تحدّد مواقع الأشخاص: والأماكن, 
والكائنات في جميع أنحاء العالم» وتشمل خطوط الطول والعرضء وإحداثيات الخرائط 
الشبكية, والوحدات الإدارية مثل الرموز البريدية (006©5© م73). وتختلف هذه الأنظمة 
ف نطاقها ودقتها (درجة التفصيل). وقد أصبحت أكثر دقة يدا هن أي وقت مضي. 
فعلى سبيل المثال» تُوسم البيانات الإدارية بالنسبة إلى الملكيات الفردية أو قطع الأراضي بدلاً 
من الأحياء؛ كما يسجّل أي جهاز يحوي نظام تحديد امواقع العالمي (8صنصه16وه2 610621 
95 -تمع9/756) الموقع في نطاق بضعة أمتار؛ وبدأت أنظمة الخرائط الوطنية بإسناد عدد 
كبير من الكائنات الناشئة بفعل بشري أو طبيعي في المخططات الخرائطية بمعرفات إقليمية 
فريدة. ويوجد معرفات فريدة أخرى شائعة على نحو متزايد للمنتجات (انظر الفصل 
الرابع) والمعاملات (على سبيل المثال. طلبات الشراء)» والتفاعلات (على سبيل المثال» البريد 
الإلكتروني والمكالمات الهاتفية). 

وفضلاً عن كونها أكثر قابلية للفهرسة والتبويب, أصبحت رموز تحديد الهوية قابلة 
للقراءة الآلية أبقيا على نحو متزايد (2005 1طء16 220 ء120018). على سبيل امثال» 
يحتوي الرمز الشريطي (8315006) على رمز تعريف يرتبط بنظام معلومات يحتفظ ببيانات 
وصفية إضافية تصف الكائن عند مسحه بقارئ ليزري (مثل نوع المنتج / النموذجء تاريخ 
ومكان الصنعء الأسعارء وما إلى ذلك). كما يمكن استشعار رقائق تحديد الهوية باستخدام 
موجات الراديو ((8711) عن بعد من قبل مستجيب راديوي والتعرف عليها. ويمكن 
كذلك التعرف على المركبات بواسطة برنامج التعرف التلقائي على أرقام لوحاتهاء وقد تم 
تطوير تقنيات خوارزمية جديدة للتعرف وتحديد هوية الوجوه وطريقة المشي (كيف ممثي 
الناس). وهكذا أصبحت عناص ر/ كائنات العالم مفتوحة لجمع والتقاط بياناتها وتحديد 
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هويتها تلقائية مما يوسّع بشكل كبير نطاق البيانات المنتجة ومدى دقتها بالنسبة إلى نظام 
اهمها قدم أشكالا جديدة من التنظيم والحوكمة (20072 صنطء)ة1 هسه عع1200) وعزز 
عمل الأنظمة بطرق أكر آلية (2011 ء12008 لصه صنطء:ة؟1). لذا فإن الاتجاه السائد هو 
امزيد والمزيد من التحديد للظواهر وا ممارسات لتصبح معرفة بشكل فريد وقابلة للقراءة 
آلبا هما يزيد الذقة, والعلائقية, والأمعة, 


تخزين البيانات (5]01286 10212): 

كان هناك تحوّل كبير. على مدى العقدين الماضيينء في القدرة على التخزين الطويل 
الأمد لكميات هائلة من البيانات» ففي البداية تم تخزين البيانات الرقمية في صورة تناظرية 
باستخدام البطاقات المثقوبة وذلك قبل أن يتم الانتقال إلى الشريط ال مغناطيسي والأقراص 
الصلبة. وقد استكملت هذه الوسائل باستخدام وسائط التخزين الرقمية المتنقلة والتي 
تعرف باسم الأقراص المرنة (5عاوذط ترممه51). وتلا ذلك ظهور الأقراص الدمجة (و02), 
وأقراص الفيديو الرقمية (12<17125): ومحركات الأقراص الخارجية والذاكرة المتنقلة (/ط5ة11 
175 2021ع8). وقد دفعت تقنيات الأقراص الصلبة (وعذعه1مصطءع' ع1وذل-11220). 
على وجه الخصوص, بالقدرة على تخزين البيانات الرقمية بشكل كبيرء وذلك مع النمو 
الكبير للسعة التخزينية المقدرة بالخانة الثنائية لكل بوصة مربعة (بت/إنش2). في حين 


6 م إلى 2000م (2000 تإضتهعط11©) واستمرت الأسعار في الهبوطء مما جعل التخزين 
الرقمي أرخص تكلفة بكثير وأقل مساحة من الأشكال التناظرية (على سبيل المثال» الورق أو 
الأشرطة الفلمية) (2003 1121620 همه 03511 طء60). فالآن: أصبحت التكاليف رخيصة 
جداً وبالشكل الذي يمكن من تخزين كميات هائلة من البيانات بمقابل بخسء ودون 
الحاجة تقريباً لحذف الملفات القديمة. ونتيجة لذلك: فإن الُعاملات التي تجري اليوم (على 
سبيل المثال» رسالة أرسلت إلى قائمة البريد الإلكتروني أو صفحة موقع التواصل الاجتماعي 
الفيسبوكء أو المدفوعات إلى متجر باستخدام بطاقة الائتمانء أو المحادثة مع أحد الأصدقاء 
على الهاتف) من الممكن تسجيلها وحفظها بشكل جيد إلى ما بعد وفاة الشخص اللعني بهاء 
مع إمكانية الإشارة إليها وتحليلها في أي وقت في المستقبل. 
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ونتيجة لذلكء. وكما نوقش في الفصل السابقء كان النمو في حجم البيانات المخزنة 
بالأرقام المطلقة والنسبية استثنائياء وخاصة منذ العام2000م. فعلى سبيل المثال» قدّر 
(2009) تعمفآ لصه أ 11116 أن خمسة وعشرين في المائة فقط من البيانات تم 
تخزينها في شكل رقمي في عام 22000 مع الاحتفاظ بما تبقى بأشكال تناظرية مثل الكتبء. 
والمجلات. والصورء والأشرطة الممغنطة. وبحلول عام 2007 مء شكلت البيانات الرقمية ما 
نسبته أربع وتسعون ف المائة من مجموع البيانات المخزنة» ومنذ ذلك الحين تواصل النمو 
للحصة النسبية من البيانات الرقمية.ء خاصة مع تطور التخزين والخدمات ال موزعة من 
خلال الحوسبة السحابية ومراكز البيانات. وتأخذ الحوسبة السحابية أحد شكلين يعملان 
في الغالب بصورة تعاونية: سحب امرافق الخدمية (0100 11117). وسَحب البيانات 
التخزينية (2011 .21 »© :ع122) (0101035 1038). فالسحب الخدمية تفن القدرات 
والإمكانات المتعلقة بتقنية المعلومات كخدمات حسب الطلب حيث ممكن الوصول إليها 
عن طريق شبكة الإنترنت وذلك بشكل مستقل عن موقع طالب الخدمة. ويشمل ذلك 
«البنية التحتية كخدمة» (1225 -ع561716 2 25 ع12125]112]115) مثل التخزين والخوادم 
والشبكات. «المنصة كخدمة» (2285 -ع561516 2 85 212]4012) وتضم بيئة التنفيذ 
لتطوير تطبيقات مخصصة وقواعد البيانات. و«البرمجيات كخدمة» (2 25 5015721 
5 -ع55613710) والتي تمكن المستخدمين من الوصول إلى التطبيقات ومعالجة البيانات 
عن بعد (2012 مله اه ععاعصداط :2011 .21 غه ه826 ). في حين ك3 سحب البيانات 
من ربطء تخزينء ومعالجة كميات هائلة من البيانات التي قد تنتج عبر المؤسسة عن 
بُعد.ء بالاعتماد على القدرة الحاسوبية لمئات من الأجهزة. وتحليلها عن طريق سحب 
المرافق الخدمية (2011 .21 :»© 2:ء:12). ومن ثمء يمكن للأفراد والشركات الاستفادة 
من التخزين والقدرة الحاسوبية دون الحاجة إلى القيام باستثمارات رأسمالية كبيرة. فضلا 
عن كونها قادرة على الاستفادة من هذه اللموارد من أي مكان يتوافر فيه اتصال بالإنترنت 
(2008 .له أء أاسمتورظ). 


وبالمثل» كان هناك تحؤل في كيفية تنسيق البيانات وهيكلتها عند تخزينها وبسبب 
الزيادة الناشئة في حجم., وسرعة» وتنوع البيانات» فقد عانت قواعد البيانات العلائقية 
للبقاء ومواجهة الموقف. فقد صَمّمت لبيانات على درجة عالية من التنظيم؛ والسلامة, 
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والمنظمة؛ والثابتة. وبدلاً عنها. ظهر شكل جديد من قواعد البيانات هو قواعد البيانات 
غير الهيكلية :5105©1). مما يتيح تخزين البيانات الكبيرة. وتميل قواعد البيانات غير 
الهيكلية إلى أن تكون أقل تعقيداً في الشكل من قواعد البيانات العلائقية ولكن يمكنها 
التعامل مع كل من البيانات المنظمة (10268 0ع1نااعنا)5) وغير المنظمة (0ع1ناغعتمنائمت] 
وهي قابلة للتوسع بسرعة؛ ويمكنها التعامل فعلاً مع العديد من مجموعات 
بيانات سريعة التغير وهائلة في الحجم. وتمتاز با مرونة في كيفية تنظيمهاء مما يتيح هياكل 
بيانات مفصضلة بحسب الطلب (2012 2ع:ه117 320 21222 :2012 11مء1(815). كما 
تميل قواعد البيانات غير الهيكلية إلى تخزين البيانات الابتدائية الخام بدلاً من المشتقة 
التي يتم هيكلتها ف لعلاقة محددة يبلن (2012 11مء1(:15). فعلى سبيل المثال, ٠‏ تخزن 
قواعد البيانات غير الهيكلية معلومات خام عن زيارة صفحة الويب (المشاهدة) دلا 
من تخزين تعداد المشاهدات للصفحات المشتقة منهاء وهي إستراتيجية أكثر قوة من 
حيث أنها تقل من الأخطاء المحتملة في قواعد البيانات. ولكن هذه الإستراتيجية لا يممكن 
تطبيقها مع قواعد البيانات العلائقية بسبب النمو السريع والحجم الناتج من ذلك النمو 
والذي لا يمكن التعامل معه من خلالها (2012 <ع5ة11 220 31212). ويتم في العادة 
توزيع البيانات وتكرارها عبر العديد من الأجهزة في قواعد البيانات غير الهيكلية, بدلا من 
مركزيتها في مكان واحد (ومن ثم حل مشكلة مجموعات البيانات الكبيرة جداً كونها كبيرة 
جداً عن أن يجري احتواؤها على جهاز واحد). وتقسّم طلبات الاستعلام ويجري تنفيذها في 
الوقت نفسه على عدد من الأجهزة جنباً إلى جنب ثم يُعاد تجميع النتائج (ومن ثم تسريع 
العمليات الححابية) (2012 الأناصنندظ). وتتلخص هذه اللإستاتبجية من خلال ثقنية 
التعيين والاختزال (م8601166818) التي تم تطويرها من قبل شركة جوجل حيث يتم تعيين 
البيانات والاستعلامات على عدة خادمات ومن ثم جمع النتائج الجزثية واختزالها معا 
(2012 الأطصتت). ويعد هادوب (م112000): الذي تم وضعه بداية من قبل شركة ياهو 
(00طقلا). مثالاً على قواعد البيانات غير الهيكلية ومفتوحة المصدر وشائعة الاستخدام في 
تطبيق نموذج التعيين والاختزال. فالحل البديل لثل هذا النهج يتمثل باستخدام نموذج 
أكثر محدودية للبيانات» ودرجة أقل من العلائقية في مجموعة البيانات» وقدرة أقل على 
الاستكشاف باستخدام لغة الاستعلام العلائقية (2012 11ه2215) (:501). وهذا يعني أن 
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قواعد البيانات غير الهيكلية مثالية للتخزين الفعال والاسترجاع السريع لكميات هائلة من 
البياناتء ولكنها أقل فائدة لفحص العلاقات بين عناصر البيانات (مركز تحالف البيانات 
ا مفتوحة 2012 عع2ة1[لى تتعاخمءن) 10260 معم 0 


مصادر البيانات الكبيرة (10268 عذ8 01 وعع50111): 

وفر التوسع الجذري والتكامل بين الحوسبة. والشبكات. والأجهزة الرقمية, وتخزين 
البيانات منصة قوية لانطلاقة البيانات الكبيرة. وإضافة لذلك الوسيلة التي يتم بها إنتاج» 
ومعالجة. ومشاركة» وتحليل البيانات الكبيرة. ويمكن تصنيف هذا الإنتاج للبيانات في ثلاث 
فئات رئيسية. البيانات الموجهة (1028 لعاءع:101) والتي يتم إنتاجها بوسائل مراقبة 
تقليدية. حيث تتركز أنظار التقنية على شخص أو مكان من قبل مشغّل بشري. أما في حالة 
البيانات الآلية (10862 02]64]ندة).» فتنتج البيانات عن وظيفة كامنة في الجهاز أو النظام 
بطريقة تلقائية» في حين يتم تداول البيانات الطوعية (10262 2ع701126661؟) وإهداؤها من 
قبل الناس للنظام. 


البيانات الموجهة (12264 60]ءء121): 


توجد الراقبة المنظمة والهيكلية حيثما وؤجدت مجموعة من الناس الذين يشرفون 
على أشخاص آخرين كال مسؤولين عن إنفاذ القانونء والمعلمين» والأطباء. ومسؤولي الرعاية 
الاجتماعية» والبيروقراطيين» ورؤساء العمل والذين يعملون على مراقبة الآخرين شخصيا 
كامواطنين» والتلاميذ. والمرضىء والعمال أو من خلال العدسات التقنية كا مسوح مثل التعداد 
السكانيء ونماذج البيانات الحكومية. وإيصالات الضرائبء وعمليات التفتيشء وكاميرات 
مراقبة الدوائر التلفزيونية ا لمغلقة (0017).: حيث كانت المراقبة المنظمة والهيكلية 
مكل قوة ظويلة بمطة عن سراف اللحششاكه ومكذنا أساسا عن مكوفات الدولة معوكمة 
الشركات (2007 <هتز:آ). فهذا النموذج للتحكم (التداخل المنطقي» الأدوات: المؤسسات» 
وأدوار وإجراءات الحوكمة) يتيبح مركزية التنظيم والتحكم عبر مجموعة واسعة من 
المجالات. ويساعد في الحفاظ على النظام» وإنتاج حكومة جيدة. وإدارة فعالة. وعمل مربح» 
ومجتمعات مستدامة ومستقرة» من خلال المحاسبة الفعّالة للأشخاص والتهذيب الذاتي 
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أيضاً (بمعنى: تعديل الناس سلوكهم ليتوافق مع التوقعات والقواعد). وتّستكمل هذه 
النظم بطرق تحديد هوية الأفراد. مثل بصمات الأصابع؛ والصور, وأرقام التأمين الوطني أو 
الضمان الاجتماعي. وجوازات السفر ورخص القيادة» التي تجعل من السهل تتبع واقتفاء 
أثر الناس» كما تمّ توسيع نطاق المراقبة ليشمل الحيوانات والبيئات» واستخدام الكائنات 
وحركتها. 

وحتى وقت قريب. كانت كل عمليات امراقبة جزئية وتناظرية بطبيعتها وتنتج 
مس وراك مخملقة فن البانات المتمشلة يدا هن الملاعظات غير االبقلة إل السعلات 
التفصيلية أو التسجيل الممستمر ويجري تطبيقها أحياناً على عينات وفي حالات قليلة على 
المجتمع بأكمله. وكانت البيانات المسجّلة انتقائية. تجمع من خلال التقارير أو الإبلاغ 
الذاتي على الورق أو على شريط مغناطيسي أو فيلم» في مكان وزمان معيّنين. وتميل البيانات 
إلى أن تكون منظمة للغاية في طبيعتهاء ومقتصرة على مجموعة من حقول البيانات ا لمحددة 
مسبقا. وكانت السجلات ضخمة ومكلفة في التخزين, مما يعني عدم الاحتفاظ الطويل 
الأمد بها إلا لكمية محدودة من البيانات» إضافة إلى كون الكثير منها إما عبارة عن عينة 
أو مشتقة. وحتى في الحالات التي قد تكون المراقبة فيها مستمرة, مثل الدوائر التلفزيونية 
المغلقة, فقد تمتدٌ اللقطات نفسها على فترات زمنية طويلة تتعدى قدرة الشريط التسجيلي 
على تغطيتها ويجري في العموم إعادة التسجيل عليها بعد فترة معينة (غالباً بعد سبعة 
أيام أو شهر). كما كان تحليل البيانات الناتجة من مختلف أشكل امراقبة المستخدمة 
يتم بواسطة مفسّر بشري إلا إذا جرى تحويلها رقمياً في وقت لاحق. وفي حين أن كميات 
البيانات التي تنتجها هذه المراقبة يمكن أن تكون ضخمة: وربما تستوفي واحدة أو اثنتين من 
الخصائص المرتبطة بالبيانات الكبيرة مثل قابلية الفهرسة والشمولية والعلائقية أو السرعة, 
إلا أنه لا يمكنها بأي حال أن تستوفي مجموعة الصفات المرتبطة بالبيانات الكبيرة كاملة. 

وفي حين لا تزال العديد من أنظمة المراقبة والحوكمة مستمرة في كونها جزئية وتناظرية, 
كان هناك تحرّك في الآونة الأخيرة لاستبدالها والتوسع فيها بنظائر رقمية مكافئة لها والتي 
تنتج الآن بيانات كبيرة. فعلى سبيل المثالء يجري استبدال أنظمة الدوائر التلفزيونية 
ا مغلقة التماثلية الثابتة بأخرى رقمية متحركة حيث يمكن تغيير مجال الرؤية» والتقليل من 
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المحددات على التخزينء وتعزيز التفسير البشري بتحليلات خوارزمية حسابية. مثل التعرف 
على الوجه أو طريقة المشيء كما يمكن ربط مثل هذه البيانات مع قواعد بيانات أخرى. 
وهناء يوجّه تركيز الكاميراء وعمليات التحليل والتفسيرء من قبل مشغل بشريء وبمساعدة 
من البرمجيات. على سبيل اللثالء من الممكن مراقبة وضبط العديد من الكاميرات في 
غرفة عمليات الشرطة وربطها بسجل الحوادث الحية من أجل الاستجابة بكفاءة وتوجيه 
الموارد ا لمناسبة للواقع معينة بشكل استباقي. وبامثلء في مراقبة الهجرة والجوازات. حيث 
يجري آنياً جمع معلومات الركاب التفصيلية وتدقيقها مع مختلف قواعد البيانات الأمنية 
والحدودية بشكل آني أو لحظي (8631-13526). وإنتاج بيانات جديدة مثل المسح الضوثئي 
للصور الشخصية وبصمات الأصابع أو قزحية العين. وتستخدم العديد من الحكومات 
المحلية أنظمة إدارية لتسجيل مشاركات المواطنين مع خدماتها آنيا ورصد إن كان تعامل 
الموظفين مع أي قضايا قد تم ضمن أطر زمنية محددة, مع مراقبة مديري الإشراف للنظام 
لإعادة توجيه الموارد بحسب الحاجة. 


وتتكوّن بعض الأنواع الأخرى الأقل انتظاماً في إنتاج البيانات الكبيرة الموجّهة من: 
التصوير الجوي الرقمي عن طريق الطائرات أو الطائرات بدون طيارء أو الفيديو المكاني» 
أو الليدار (الرادار بتقنية الليزر) لكشف الضوء وتحديد مدى البُعدء أو الحرارية أو غيرها 
من أنواع الأشعة الكهرومغناطيسية للبيئات التي تمكن من الرسم المتحرك للخرائط الثنائية 
والثلاثية الأبعاد للمناظر الطبيعية المفهرسة مكانياً بشكل آني أو لحظي (06:ذ5641-1) من 
خلال نظام تحديد المواقع العالمي (6725). وتنتج مثل هذه الفيديوهات والمسوح بالأشعة 
كميات هائلة من البيانات المتنوعة عالية السرعة. فعلى سبيل المثالء يمكن باسح الليدار 
توليد مليون نقطة بيانيةء مع دقة بيانية تصل إلى بضعة سنتيمترات» مع إمكانية إجراء أكثر 
من مسح خلال الثانية الواحدة. إن وضع ماسح ليدري في مركبة وقيادتها في الأنحاء» أو 
الطيران به فوق منطقة معينة ينتج تمثيلا ثلائي الأبعاد مفضّلاً للغاية للتضاريس الطبيعية 
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البيانات الآلية (122620 0ع226زمغتدى): 

في حين وسّعت البيانات الموجّهة أنظمة ا مراقبة والحوكمة التقليدية. فقد حوّل إنتاج 
البيانات الآلية بشكل جذري كيفية إنتاج البيانات وتوظيف استخداماتهاء ومكن من إنشاء 
أنظمة جديدة للتنظيم والإدارة التلقائية (220 صنداء16] ,و2007 صنطءغك1 ممه ءع1200 
1 »ع00086]؛ انظر الفصل العاشر). فمن خلال مجموعة من التقنيات الرقمية يتم إنشاء 
البيانات تلقائيا بواسطة مجموعة من النظم الآلية وبرقابة بشرية قليلة. وعلاوة على 
ذلك» يتم في الغالب معالجة وتحليل مثل هذه البيانات تلقائيا وبشكل مستقلء إذ يجري 
العمل عليها بواسطة خوارزميات برمجية لتحقيق نتيجة معينة تهدف إلى تنظيم ظاهرة 
ما. وهناك طرق عديدة لإنتاج البيانات الآلية؛ بعضها قد يكون إنتاجه ثانويا عن النظام 
وليس من صميم عمله. 


المراقبة الآلية (ءععصدللء15ا5 02221660)ندد): 

كما أصبحت تقنيات المراقبة رقمية بطبيعتها ومرتبطة بعضها ببعضء فقد أصبح من 
الممكن أيضاً أتمتة جوائب متعددة لنظام المراقبة. وإضافة تقنيات جديدة لتتبع أكثر فعالية 
وكفاءة في مراقبة وتتبع الاستخدام للأنظمة والأماكن المختلفة. وتعدٌ قراءة العدادات 
الذكية مثالا على النموذج اليدوي من امراقبة التي غدت آلية بشكل متزايد. هناء يتم 
استخدام تقنية قراءة العداد آلياً (1/لى لع صنلدع] زعغء11 عننددرم نظ ) مراقبة استخدام 
الآلة والتواصل معها دون الحاجة إلى القراءة اليدوية التقليدية (2013 .21 © عكاعمةآ]). 
وعلاوة على ذلكء يمكنها القيام بهذه المهام بشكل متواصل مما يمكن ا مورّد من تتبع 
الااستخدام بشكل آني أو لحظيء وهذا له فائدة في مطابقة الطلب مع العرض وفي العثور 
على أخطاء / تسريبات في النظام. كما أنها توفر وسيلة للقيام بالفوترة الآلية مما يحدّ من 
نفقات التوظيف. وفي كثير من الحالات, من الممكن للمستهلك أيضاً أن يراقب استهلاكه 
الخاص لخدمة معينة, مثل الكهرباء أو الغاز أو المياه. فعلى سبيل المثالء يمكن استخدام 
تطبيق للهاتف الذي للاتصال بعداد عن بعد باستخدام تقنية اتصال المجال القريب على 
سبيل المثال» البلوتوث» ومن ثم تغيير الاستهلاك تبعاً لذلك. 
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وبالمثلء تعزز أنظمة إدارة المرور من القدرة على تنظيم وضبط السائقين من خلال 
الاستفادة من تقنية التعرف الآلي على أرقام لوحات المركبات (6غ212 نء انآ ع2 درمتم 
2 تلتنطء 11 لد ع12008) 21م -ده1انمعمء»11). فهناء تمسح الخوارزميات 
بيانات الصور من الكاميرات الرقمية للكشف عن لوحات الترخيص. ومن جية. يمكن 
استخدام هذه المعلومات لتتبع المركبات خلال عبورها على طرقات ال مدينة وتقديم مدخلات 
إلى نظم النقل الذكية (11'5 -قصعغة:ز5 م0120 مقصهكا” غمعع ن[اءغم1). ومن جية أخرى» 
يمكن إحالة هذه البيانات إلى قاعدة بيانات مالكي المركبات لإدارة الغرامات والعقوبات 
امتعلقة بالمخالفات المرورية. فعلى سبيل امثالء بالنسبة للمثال السابق» يتم فحص لوحة 
الترخيص لجميع المركبات الداخلة إلى منطقة الزحام المروري في لندن ومطابقتها مع قاعدة 
بيانات تلك المركبات التي سددّت رسو الازدحام: أما تلك التي لم تسدّد خلال فترة أربع 
وعشرين ساعة فيتم تغريم مالكيها تلقائيا من خلال عملية الإدارة الآلية (يتمتع النظام 
باستقلالية في إصدار الغرامات دون الحاجة لرقابة بشرية). ويمكن للنظام بالمثل استخدام 
كاميرات السرعة لإصدار قسائم تجاوز السرعة للسائقين المخالفين. 


وفي حالات أخرىء تم تسهيل امراقبة الآلية من خلال استخدام رموز الهوية المقروءة 
آليا لتسجيل ماهية الأنشطة المريبة/ المجهولة على شبكة المراقبة. فعلى سبيل المثال» تم 
استبدال التذاكر الورقية التي يتزايد تبادلها في السفر على نظام النقل من غير حامليها 
بالبطاقات الذكية» التي ينبغي التدقيق عليها لدخول وخروج المحطات ووسائل النقل. 
ويتم إنشاء سجل عند نقاط ا مسح ومن ثم يمكن تتبع كل حركات حاملي البطاقات الذكية. 
وفي حالة نظام النقل في لندنء فإن استخدام بطاقات أويستر (0775]65) يعني أنه من 
ا ممكن تتبع الرحلات الفردية عبر نظام الحافلات والسكك الحديدية اللمستخدمة من قبل 
مليوني راكب يومياً (2012 .21 غ© 8157). وبالمثلء من الممكن الآن المراقبة التلقائية 
لأشكال متنوعة من الخدمات العامة المقدمة التي كان يجري رصدها عرضاء مثل جمع 
النفايات. من خلال استخدام رقائق تحديد الهوية باستخدام موجات الراديو (118110) التي 
تثبّت على حاويات النفايات ويتم مسحها عن بعد عند نقاط الجمع. وأصبح من الممكن 
قياس كميات التخلص من النفايات باستخدام مقاييس مرفقة بمجموعة مركبات وتحميل 
الأسر بصورة فردية تكلفة التخلص من النفايات على أساس الحجم بدلا من الرسم الموحد 
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دون تمييق: كما أضبح من ا ممكن أيضاً الحصول على فهم مفصّل لأفاط التخلض من 
النفايات داخل منطقة ما وإعادة تخطيط طرق وأوقات الجمع. 


الأجهزة الرقمية (وءع17»3 1121ع1): 

كما سبق الإشارة إليه. كان هناك نمو هائل في عدد الأجهزة الرقمية ا مستخدمة حول 
العالم والتي تساعد على تسهيلء وتعزيزء وإدارة العديد من جوانب الحياة اليومية. فهذه 
الأجهزة لا تقوم بمجرد معالجة البيانات الرقمية والتعليمات فحسب. ولكنها تنتج بيانات 
رقمية بشكل نشط وكوظيفة أساسية لها أو ثانوية» أو الاثنين على حدّ سواء. ومن الأمثلة على 
الأجهزة التي تنتج بيانات رقمية كوظيفة أساسية: الكاميرات. وأشرطة الفيديوء والمراقيب 
ووحدات تحديد المواقع (625). وأشكال مختلفة من المعدات الطبية مثل كاميرات المنظار» 
والماسحات بالموجات فوق الصوتية» وموازين الحرارة الرقمية, إلخ. أما أمثلة الأجهزة التي 
تنتج بيانات رقمية كوظيفة ثانوية» فتشمل الهواتف النقالة ومستقبلات البث التلفزيوني 
عبر الكابل أو الأقمار الصناعية» والتي تنتج بيانات متعلقة بكيفية استخدامها (على 
سبيل المثال» الوقت, المكان. الشخص المتصل / القناة المشاهدة). مع البيانات المتصلة 
بها والتي جرى جمعها في سجلات يتم إرسالها إلى أطراف ثالثة (مثل مصنعي الأجهزة 
ومقدمي الخدمات). أما الأمثلة على الأجهزة التي تنتج البيانات الأساسية والثانوية معا 
فتشمل الهواتف الذكية التي يمكن استخدامها لتسجيل الملاحظات. والتقاط الصورء وكتابة 
البريد الإلكتروني والتعليقات على وسائل التواصل الاجتماعيء ...إلخ. بالإضافة إلى تسجيل 
استخدام مختلف التطبيقات. وتشكل هذه الأجهزة سلالة جديدة من الكائنات» : تسمى 
لوجكتس (2011 100086 320 انداء141) (ئاءءزع1:0) - كائنات ترصد وتتبع تاريخ 
استخدامها الخاص. وفي كثير من الحالات. يكون من الممكن تسجيل موقع هذه الأجهزة. 
فالهاتف الجوال والهواتف الذكية يمكن تتبّعها من الفضاء عن طريق التثليث (حساب 
المقلقات) غير هوافيات الهاتف: وأيضا عن طريق مستقبلات تحديد المواقع المدمجة فيهاء 
بالإضافة إلى مراقبة السرعة والاتجاه من خلال ال مدوار (5©ع037705602)» ومقاييس التسارع 
(1026]618ءاءععش)ء والبوصلات (010225565©) على شكل أقراص أسطوانية, أو أجهزة 
ملاحة بالأقمار الصناعية أو أي أجهزة أخرى. وعلاوة على ذلك. فإن العديد من هذه 
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الأجهزة يمكن أن تتفاعل بشكل مستقل بعضها مع بعض وتقوم بتبادل البيانات. ومع تكاثر 
الأجهزة المعقدة لكافة المهام وفي كل الأماكن يتم إنتاج المزيد والمزيد من البيانات الغنية 
بالبيانات الوصفية القابلة للفهرسة. مما يتيح تحليلا أكثر تطورا واستحداث إستراتيجيات 
ومنتجات حديدة قانمة على البيانات. 


البيانات المستشعرة (10262 01عدء5): 

تعد المستشعرات والمحركات من أنواع الأجهزة الرقمية. وهي ما يمكن أن تكون ضمناً 
أو جزءاً من هياكل مختلفة لقياس مخرجات معينة مثل مستويات الضوء. والرطوبة» ودرجة 
الحرارة» والغازء والمواد الكيميائية, والمقاومة الكهربائية. والصوتيات. وضغط الهواءء. والحركة, 
والسرعة. ...إلخ. وتعد أجهزة الاستشعار والمحركات صغيرة» وغير مكلفة في العموم: ويمكنها 
إنتاج تيار مستمر من البيانات» ويمكن أن تكون سلبية وتقرئ بواسطة الماسحات الضوئية, 
أو مكق أكون نش طلة, يفي قث المانات صل قرات متسكلية غير السيكات الحاست 
ا محلية أو الواسعة. أو قد يكون لديها قدرة الاتصال من خلال حقل الاتصالات القريب 
(8180) والذي يتيح الاتصالات في اتجاهين (2013 .21 © عكاءد112). وبوضعها على جسر 
يمكن للمستشعرات أن تقيس وتتواصل لحساب معدلات التآكل (عن طريق قياس ال مقاومة 
الكهربائية) ومقدار الضغط على مواد البناء باستخدام أجهزة استشعار الانبعاثات الصوتية 
(للكشف عن انتشار الموجات الصوتية) وأجهزة استشعار التخصّر المغناطيسي (للكشف عن 
تغيرات في الحث ا مغناطيسي). ومن ثم يقلل ذلك من الحاجة إلى التفتيش اليدوي ا مكلف 
(2013 .81 » عكاعصدآط). وبال مثلء ممكن للمستشعرات داخل نظام امياه قياس نوعية 
ا مياه وضغطهاء ومقدار تدفقهاء وتمكين الإدارة الآنية وصيانة الأنابيب لحظة بلحظة. وعلى 
ا مركبات» يمكن للمستشعرات رصد حجم العملء والإجهاد, والتضاريس. فشركة هيتاثي 
تستخدم هذه اللمجسات لرصد مركباتها الثقيلة المعقدة والمكلفة, وكذلك تفعل الشيء نفسه 
شركة النقل السريع (1755) مع أسطولها من عربات النقل والشاحنات بحيث توظفها 
لتشغيل خدماتها بكفاءة وبصورة استاقية (اععء طدطمطء12-5ء:1/127 :2012 عع110مصتن[اط 
0:11:73 4صه). ومن خلال ربط رقائق تحديد الهوية باستخدام موجات الراديو 
(8110) بالمنتجات أصبح من الممكن رصد وتتبع حركة الوحدات الفردية من المصنع 
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أو المزرعة إلى المستهلكء والحدٌ من السرقة والهدر. وبالمثلء تحتوي بطاقة الضريبة على 
شريحة تحديد الهوية باستخدام موجات الراديو التي تتواصل مع قارئ ترددات راديوي 
على حواجز تحصيل الرسوم. مما يؤدي إلى سرعة أعلى في حركة المركبات والدفع الآليء 
بالإضافة إلى حساب معدل حركة المركبات أو عدد مواقف السيارات امتاحة لإدارة حركة 
ا مرور. كما تثبّت رقائق تحديد الهوية باستخدام موجات الراديو على الحافلات والقطارات 
والتي تتواصل مع قارئ الموجات الراديوية على طول مساراتها مما يجعل من الممكن تتبع 
موقع المركبات في أي لحظة آنيا. 

كما يمكن إنشاء شبكة استشعار كثيفة من خلال توزيع العديد من أجهزة الاستشعار 
وربط البيانات التي تنتجهاء مما يتيح رصد أوضاع مختلفة عبر نظام أو مكان ما. وقد 
توالت الأمثلة على هذه الشبكات وأجهزة الاستشعار في مدينة سانتاندر (7ع0صهغصه5) في 
إسبانيا كجزء من مشروع المدينة الذكية (20617ه]هة2165د585).: وفيه 12000 من أجهزة 
الاستشعارء وتتكون من خمسة أنواع؛ تم توزيعها بشكل إستراتيجي في جميع أنحاء المدينة 
لقياس الضوضاءء والحرارةء ومستويات الإضاءة المحيطة» وتركيز غاز أول أكسيد الكربون 
والأماكن اللقواقرة لوقوف السبارات وركنها (181815523013).. وترقط الميزة الستشعار معاً 
مو خلال الافضالات اللأسلكنة وتوظيق ابرح هع لأف و1614 مدا مكق هق عرسوتها 
وتحديث برمجياتها عن بعد (2013 152ء81). كما يجري تطوير وادي بلان آي في (1لصهاط) 
في البرتغال» وهو في الوقت الحاضر تحت الإنشاء ومصمّم لإيواء 225 ألف نسمة. ويهدف 
إلى إنشاء بيئة قائمة على أكثر من 100 مليون جهاز استشعار مدمج فيها والتي سوف تنتج 
بيانات لرصد مجموعة متنوعة من البنى التحتية والبيئات (2012 1)]عطاء3121). وهكذاء 
نظو إلى السدرات نوسقها عتشرا أساضيا في التطورات التي تشهدها المدينة الذكية. 


بيانات المسح الضوئي (10268 صهه5): 

بالإضافة إلى الأجهزة الرقمية وأجهزة الاستشعار التي تنتج البيانات بشكل نشط والتي 
هي جزء من شبكة إنترنت الأشياء. من ا ممكن رصد وتتبُع الكائناث الأخرى رقنياً من خلال 
رموز الهوية المقروءة آلياً. وقد تجاوز استخدام الرمز الشريطي (8:046) قطاع البيع 
بالتجزئة ليشمل السلع المصنعة والاستمارات الرسمية» كما وضعت العديد من ال منظمات 
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الكبرى والقطاعات الصناعية نموذجها الخاص من الرمز الشريطي ومعابيرها لتخصيص 
الأرقام (2005 صتطء ك1 امه عع1200). وتمثل البيانات في الرموز الشريطية ثنائية الأبعاد 
أفقيا وراهيا مموغة من الشاظ اللرقطة يكن اجههذانه) لمسدين كاتى يشكل قرين: 
وتستخدم بعض خدمات البريد هذه الرموز الشريطية الثنائية الأبعاد لتمكين المتابعة 
والتعقيب للرسائل والطرود البريدية بشكل فردي. وبا مثل» تحتوي الشرائط ا مغناطيسية 
المثبتة على بطاقات الائتمان والولاء وبطاقات السماح بالعبور من خلال الأبواب على معرّف 
فريد يختص بصاحب البطاقة التي يتم قراءتها عند تمريرها على القارئ. وقد جرى استبدالها 
لاحقاً برقائق إلكترونية يمكن التحقق من البيانات التفصيلية فيها باستخدام الأرقام السريّة 
الشخصية لمستخدميها. كما يتم إنتاج البيانات الخاصة بالاستعمال, في كل مرة يجري فيها 
مسح الرمز الشريطي أو الشريط المغناطيسي أو الرقاقة الإلكترونية, متضمناً ذلك أين ومتى تمّ 
الاستخدام ولأي غرض. وبالنظر إلى أن الغرض من هذا اللمسح في كثير من الحالات هو لشراء 
السلع. فهي توفر وسائل مهمة لإنتاج معلومات عالية الدقة والتفصيل للصفقات المبرمة. 


البيانات التفاعلية (10262 102اء122ء121): 

على الرغم من أن بعض مستخدمي الإنترنت ينظرون إليها باعتبارها وسطاً مجهول 
المعالم إلى حدٌ ماء إلا أن كل تفاعلات المستخدمين الجارية عبر شبكات المعلومات والاتصالات 
تنتج بيانات تفاعلية. وحقيقة: فإن إنتاج البيانات هو قائم بطبيعته على العديد من أشكال 
الاتصال والاستخدام في شبكات تقنية المعلومات والاتصالات. على سبيل المثال» يتعقب 
مزودو خدمات الإنترنت المواقع التي تتصل بها حسابات المستخدمين الفردية والأجهزة, 
وتستخدم العديد من المواقع. وخاصة مواقع الشركات. سجل التتبع وتعريف الارتباط 
للمتصفح (كوكيز و000186) لإنتاج بيانات النقر (اختيارات االمستخدم) لتتبع كيفية تنقل 
المستخدم خلال الموقع على شبكة الإنترنت وما الميزات التي جرى اختيارها. وبشكل عام 
تستخدم مثل هذه البيانات لمراقبة كيفية أداء الموقع الإلكترونيء وإجراء أبحاث عن السوق 
وتتبّع مسار إنتاجية الموظفء مع إمكانية بيع هذه البيانات إلى أطراف أخرى. ويتم 
إنشاء بيانات النقر هذه بصورة تلقائية ما مم يُعدْ المستخدم تطبيق المتصفح لعدم قبول 
ملفات تعريف الارتباط (وهذا قد يضعف استخدام الموقع). وباطثلء يتم تخصيص رموز 
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تعريفية فريدة في جميع الصفقات امالية القانمة على تكنولوجيا المعلومات والاتصالات, 
سواء الخدمات المصرفية الشخصية الإلكترونية» أو عمليات سحب أموال من أجهزة الصراف 
الآليء أو عمليات المتاجرة في الأمهم. ويجري تخزين بيانات هذه المعاملات تباعاً. وتحتوي 
جميع رسائل البريد الإلكتروني على رؤوس في مقدمة حزم بياناتها والتي تقوم بتحديد البريد 
الإلكتروني بشكل فريد. وتحتوي على معلومات تشمل المرسل والمتلقيء والخوادم والأجهزة 
الممستخدمة. وعلى المنوال نفسه. يتم تمييز جميع المكالمات الهاتفية بمعلومات المتلقي 
للمكالمة: ووقت إجرائها ومدة بقائها. وما إذا كان الهاتف محمولاً والموقع. ونتيجة لذلك 
يتم إنشاء كميات هائلة من البيانات بشكل روتيني بشأن التفاعلات الحاصلة عبر شبكات 
تكنولوجيا المعلومات والاتصالات. 


البيانات التطوعية (10262 0ع12ءع11126ه؟17): 

على النقيض من امراقبة الموجهة إلى الأشخاص أو الأشياء من قبل الأفراد والهيئات, 
أو تلك التي يتم التقاطها تلقائيا باعتبارها ميزة متأصلة لجهاز أو نظام ماء فإن كثيراً 
من البيانات الكبيرة يتم إنتاجها من قبل الناس بشكل تطوعي فعال. ففي مثل هذه 
الحالات. ينتج الأفراد البيانات ويقومون بإدخالها للعمل على الاستفادة من خدمة 
(مثل وسائل التواصل الاجتماعي)» أو المشاركة في مشروع جماعي مثل مشروع خريطة 
الشارع ال مفتوح (1713.01:8] 1151© 0://9018710.02]]) أو موسوعة الإنترنت ويكيبيديا 
(2.018خ0ء صرف[ 1ذ.5://17171م6). ويسمى مثل هذ العمل بالإنتاج الاجتماعي 
(0منتناوه:5) حيث تختلط أنماط الإنتاج والاستهلاك جزتياً بعضها في بعض, 
مع اكتساب الأفراد دوراً في إنتاج الخدمة أو المنتج الذي يستهلكونه (قصه 526 
0 <111862501[). فعلى سبيل اطثال. يجري إنتاج واستهلاك محتوى مواقع التواصل 
الاجتماعي في ذات الوقت من قبل الأفراد المستخدمين عن طريق إدخال التعليقات, 
تحميل الصور ومقاطع الفيديوء والمشاركة في مناقشة وتبادل المشاعر («الإعجاب» 
أو «عدم الإعجاب» للشيء). ومن خلال جهودهم الجماعية» يُنشئ الأفراد المنتجات 
والخدمات التي يشاركون فيها ويضيفون قيمة لها ويستخرجون القيمة منهاء بحسب ما 
أشار إليه (2006) :16 1م85 بمصطلح «ثروة الشبكات». وفي معظم الأحوالء يقوم أفراد 
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الإنتاج الاجتماعي بهذا العمل الإضافي بمقابل مادي قليل أو دون أي تعويضء وذلك إما 
للحصول على متعة المهمة, أو الشعور بالسلطة. أو توفيرهم المال والوقت مع انخفاض 
تكلفة الخدمة والتي غالباً ما تصبح أكثر مرونة بطبيعتها مثل الخدمات المصرفية عبر 
الإنترنت أو الحجز في رحلة طيران من المنزل. في المقابل» يتلقى مزوّد الخدمة أو متاجر 
السوفة عملا دون تكلقة بالاضافة إل الخيرات والاراء وااللصرفة واكستاب الكناءة 
ومعلومات ذات قيمة من خلال القرب أكثر من العملاء / الزبائن والقدرة على تسييل 
بياناتهم (2013 صنطءغك1 حصد عع1200 :2010 «مقمعع 11[ مه 8162). فبعض أشكال 
الإنتاج الاجتماعي هي أقرب إلى الخدمة الذاتية ومقيدّة بطبيعتهاء مع قيام أفرادها بالأعمال 
التي كانت مسندة إلى موظفين, في حين أن البعض الآخر أكثر انفتاحا وتفاعلية. وهناء 
سيتم م مناقشة خمسة أشكال للبيانات التطوعية باختصار: اللعاماقك (كقطهتأعوقصه ]1 ): 
ووسائل التواصل الاجتماعي (1160132 506121). والطراقبة الحية (عء26ة1لء50057)» 
والتعهيد الجماعي (عطف 0111 01051705): وعلم اطواطنة (ععمعك5 معجتازن). 


المعاملات (05ماء2قصد1): 


يتطلب الشراء عن طريق الإنترنت من المشتري إدخال البيانات الشخصية له فيما يخص 
عملية الدفع والغفوان وغيرهاتسق: الباتنااك الوضقية الشرووية التشبرى ناعبارها هرقا 
عملية للتحقق وتبادل المعلومات ولكن أيضاً لمعرفة المزيد عن المستهلك. وعادة ما تكون 
التفاعلات في مثل هذه التبادلات محدودة إلى حدّ ماء وتقتصر على اختيار ماهية بنود 
الشراء. والعديد من حقول البيانات الإلزامية لوضع اللمسات الأخيرة وإتمام عملية الشراء. 
وبعد تبادل المعلومات» من الممكن طلب المزيد من المعلومات من المستخدمينء إما لتقييم 
أداء الموقع وخدمة العملاءء أو لتصنيف ومراجعة بيانات البند الذي تم شراؤه. وتضيف 
بيانات المراجعة هذه قيمة للموقع من خلال اقتراح كيفية تحسين التصميم وكذلك تزود 
ا مستهلكين الآخرين بردود الأفعال (15ء86602) عن مدى جودة وكفاءة المنتجات. فعلى 
مواقع إلكترونية مثل (تامع:ده20715ص1].//:مط)» بمكن لأفراد الإنتاج ا مجتمعي 
تقييم واستعراض الفنادق وخدمات السفر الأخرىء مثل البيانات التي يجري تقدمها طوعا 
على الموقع عن حركة المرورء وبتْ الإعلانات والإشارة إلى مواطن الربح المحتملة» مما يكون 
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له تأثبر ملحوظ في اختيارات المسافرين الآغرين. كما يوفر الموقع بيانات مقيدة حول 
الشخص الذي تطوّع لإجراء الاستعراض والتقييم» مثل خيارات أسلوب الحياة والإنفاق 
خلال السفر التي يمكن تسييلها مالياً عن طريق بيعها إلى أطراف ثالثة. وبالمثلء تتطلب 
تعبئة النماذج الإلكترونية الحكومية من ال مواطن تقديم معلومات للموقع بشكل تطوعي. 
وهناء يكون هنالك تبادل للبيانات يتعدى حدود عملية الدفع للمبالغ النقدية. فبعض 
البيانات الإضافية الأخرى يمكن أن تكون مرتبطة بالمعاملات. مثل بيانات مسار النقر على 
الصفحات ومعلومات بطاقة الولاء» مما يتيح بناء ملف مبدئي للشخص يكن البناء عليه مع 
مرور الزمن أو يتم ربطه مع مصادر البيانات الأخرى مثل بيانات التوزيع الجغرافي للسكان. 


التواصل الاجتماعي (012ع54 لم50 ): 

قبل الخاع 8#« م كانت تسيكة الإنترنت إل حد كبير وسطأ للبث الإغلامي مكن من 
خلالها للناس تقديم المعلومات أو شراء البضائع. وكانت هناك لوحات الإعلانات والقوائم 
البريدية التي يستطيع الناس من خلالها التواصل ولكنها كانت قائمة على استخدام النصوص 
فقط, ومحددة بطريقة عرض بدلاً من كونها وسيلة مفتوحة وعامة. وبينما يمكن للأفراد 
إنتاج أشكال أخرى من ال محتوى مثل صفحات الويب إلا أن ذلك يتطلب امهارة لإنشاء 
مثل هذه الصفحات وشراء اسم النطاقء وكانت هذه الصفحات ثابتة إلى حدّ كبير وينبغي 
تحريرها بشكل رئيسي على الطريقة اليدوية ليجري تحديثها. واعتباراً من العام ٠١6‏ "ام, 
وعلى الرغم من ذلك بدأت طبيعة شبكة الإنترنت بالتغيّر لتصبح أكثر تفاعلية وتشاركية 
وديناميةء وقد تم الإشارة إلى هذا التحول على أنه الانتقال من إصدار شبكة الويب الأول 
(1.0 ط186) إلى الإصدار الثاني (2005 ترللنع8”©) (2.0 ط1176) . 

وعوضاً عن محتوى الويب الذي يجري تقدهه إلى حد كبير من قبل ا مختصين ومصممي 
المواقع الإلكترونية, فقد أصبح لأي شخص إمكانية إنشاء محتوى يمكن تحديثه بشكل 
مستمر. وعلاوة على ذلكء يمكن الوصول إلى هذا المحتوى والتفاعل معه من خلال 
محوغة مسوعة من لتساك مفل المؤافف الذكنة والكموسية اللمعيف: وجدلا من جرد 
تصفج المغلومات أو تقبيدها ف مناقفات ضيقة نسبياء أضبخ هن الممكن للناس المشاركة 
بسهولة وبشكل فعال في إنتاج عاط الإنترنت وتصميم وتحرير المحتوىء والإسهام بحرية في 
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الخدمات التي تتبادل المواد مع الآخرين. وفي حين تم اعتبار الإصدار الأول لشبكة الويب 
(1.0 10165) وسطا للقراءة فقطء فإن الإصدار الثاني لشبكة الويب (2.0 18165) هو وسط 
للقراءة والكتابة, يممكن للناس من خلاله إضافة قيمة للمواقع عندما يقومون باستخدامها. 


وتميل مواقع الإصدار الثاني من الويب وخدماتها إلى التركيز على النشر من العديد - 
إلى - العديد. والتواصل الاجتماعي» وتوفير معلومات أكثر ثراء واتساقاً. وتشتمل الأمثلة 
على خدمات الشبكات الاجتماعية على سبيل المثال الفيسبوك وتويتر؛ والصور ومواقع 
مشاركة الفيديو على سبيل المثالء فليكر ويوتيوب؟ وا مدونات؛ وعمليات ا مزج باستخدام 
واجهات برمجة التطبيقات المفتوحة (4215) لدمج البيانات من مصادر مختلفة لإنشاء 
تطبيقات جديدة على سبيل المثال. فورسكويرء وييلب (م961). وتعتمد هذه المواقع كلها 
على المشاركة الفعالة من جمهور متحمس تتبادل المعلومات حول حياتهم والقيام بأعمال 
من قبيل الكتابة: التحرير التطبيق» التعديل» النشرء المشاركة: الوسم. التواصلء ... إلخ 
(2007 811110175 له ءء8). وعند القيام بذلك. فهم لا يتطوعون بالعمل فقطء ولكن 
بالكثير من البيانات عن أنفسهم.: متضمنا ذلك الملفات التعريفية, الصورء المواقع, الآراءء 
التفضيلات,. القيم» وشبكة اتصالاتهم الاجتماعية. ولأنه قد جرى تملك هذه ال مواقع من 
قبل مجموعة شركات تأسست حديثاء فإنه يجري تداول البيانات في أيدي مملوكة للقطاع 
الخاص والتي تسعى بدورها لإنتاج نماذج جديدة من تراكم رأس ال مال عن طريق استخراج 
القيمة منها (انظر الفصلين الثاني والسابع). 


المراقبة الذاتية (ععصه11ناء50155): 

امراقبة الحية هي الرصد الذاتي وإدارة صحة الفرد الشخصية وحياته من خلال التقنيات 
الرقمية الحميمة عان سييل اللثال: معدات اللياقة البدتية:.والحخوسبة القابلة للارتداء 
لتسجيل البيانات المتعلقة بالفرد (2003 .81 © ننحنه31). وعلى النقيض من امراقبة 
الإشرافية (ع©51117611122)» والتي يتم فيها مراقبة الفرد من موقع خارجي بواسطة شخص 
آخرء يجري توظيف وضبط امراقبة الذاتية عن وعي وإدراك الفرد لتحقيق الذات» وتوفير 
منظور داخلي أوَلي عن حياته. وعلى مدى العقد الماضيء تطورت حركة المراقبة الذاتية من 
أناس يراقبون ويسجلون بنشاط بياناتهم الشخصية والتي تُعرف أيضاً باسم حركة القياس 


1/1 ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها 


ممكنات البيانات الكبيرة ومصادرها 


الكمّي للذات أو التتبع الذاتي كمياً 561 664 نغصهد0). وبشكل عام: يراقب الأفراد جوانب 
الصحة واللياقة البدنية. ويجمعون بيانات الاستهلاك (على سبيل المثالء المواد الغذائية / 
السعرات الحرارية)» والحالات الجسدية (مثل ضغط الدم والنبض)» والحالات العاطفية 
(على سبيل المثالء المزاج ومستويات الإثارة) والأداء (على سبيل المثالء أميال المشي/ الركض 
/ الدوران المقطوعة, وعدد ساعات النوم: وأنواع النوم)» بالتعاون مع عدد من الشركات 
التي تقدّم التقنيات والخدمات المرتبطة بالمراقبة الذاتية. وتشمل شركات مراقبة الأنشطة 
الرياضية والنوم» على سبيل المثالء شركات من أمثال فت بتء ونايك بلس فيول باندء 
وحوبون (ع2ه25760[ 220 مل طهطاعنظ ,+عكلتاآ ,)ذ81)0) وا لتي تعمل على مزامنة البيانات 
الناتجة مع تطبيقات متابعة وتعقب تسمح للمستخدم برصد وتحليل بياناته الشخصية. 
ولا يجري بالضرورة مشاركة البيانات التي تم إنتاجها على نطاق أوسع. على الرغم من 
إمكانية حدوث ذلكء ولكن يجري مشاركتها مع الشركات المزوّدة للخدمة, مما يوفر لهم 
اظلاعا مافذا غان البيانات الشخصية: 


وتُعد هذه التقنيات في المرحلة الأولى من التطوير وهناك رؤى أكثر شمولاً لتسجيل 
بيانات الحياة (1:088128 5ذآ) التي تعمل على إنشاء سجل رقمي موخد لخبرات الأفراد. 
من خلال جمع متعدد الطرق عبر أجهزة استشعار رقمية. وتخزينها بشكل دائم كأرشيف 
شخصي متعدد الوسائط (2003 .21 ]© صصة381). وذلك مع عدد من نماذج الأبحاث التي 
يجري تطويرها حالياً. وتهدف سجلات بيانات الحياة إلى إنشاء سجل متصلء وقابل للبحث 
والتحليل لماضي الشخص الذي يشمل كل عملء أو كل حدث أو كل محادثة, أو كل 
موقع تمت زيارته» أو أي تعبير مادي متصّل بحياة الفرد. فضلاً عن الظروف الفزيولوجية 
داخل الجسم والأوضاع الخارجية المحيطة به (على سبيل المثالء الؤجهة» ودرجة الحرارة» 
ومستويات التلوث) (20076 طتطءغ)ق1 نه ع10008) - "أي مجمل المعلومات التي تتدفق 
خلال حياة الإنسان" (85 :2003 1082505). ومن الواضح أن إنتاج هذه السجلات عن 
الحياة يثير عدداً من الأسئلة بشأن الخصوصية: وملكية البيانات المنتجة, وطريقة استخدام 
هذه البيانات (20071 صتطاء)ة]1 مله عع1000). 


ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة, والبنى التحتية للبيانات, والنتائج المترتبة عنها لفن 


الفصل الخامس 


التعهيد الجماعي (5 111:12 21:0170150)): 
التعهيد الجماعي هو الإنتاج المشترك لوسائط الإعلام» والأفكارء والبيانات من خلال العمل 
التطوعي من قبل العديد من الناس لحل مهمة معينة. وبينما يمكن القول بأن محتوى وسائل 
التواصل الاجتماعي هي نتاج تعهيد جماعي بمعنى أنه يتمّ الحصول عليه من قبل عدد كبير 
من الناسء إلا أن الغرض من هذه المحتوى موزّع وواسع الانتشار ويفتقر إلى التركيز. فبدلاً 
من ذلكء يركز التعهيد الجماعي على الإنتاج التعاوني للمعلومات وإنشاء حلول لقضايا معينة 
من خلال الاعتماد على الطاقة, والمعارفء والمهارات» والعمل التوافقي والجماعي لحشد من 
الناس (2008 1510176). وقد بين (2008) 110106 أن هناك أربعة تطورات تدعم نمو التعهيد 
الجماعي: نهضة الهواة (بحسب اللعايير المهنية في الغالب)» وظهور حركة البرمجيات مفتوحة 
المصدر, وزيادة وفرة أدوات الإنتاج خارج إطار الشركات المصنعة, وصعود مجتمعات محلية 
حيوية ومنظمة فققا لاهتمامات الناس وميولهم على شبكة الإنترنت. فهذه التطورات 
مجتمعة مكنت من تجميع موزع وديممقراطي للأفكار والأدوات والمواد. وهناك ثلاثة أنواع 
رئيسية من التعهيد الجماعي الني تعمل في الوقت الحاضر: تلك التي تنتج خلا بشكل 
جماعي على سبيل المثال. خريطة الشارع المفتوح (22.018<تتاعع7 قاعم 807.0 //:نصاغط)» 
ويكيبيديا (012.018عم5://17771:97114م1)؛ وتلك التي تستخدم الجمهور لتقييم حلول أو 
منتجات متعددة على سبيل امثال. موقع شركة أمازون (مامء. حم جهمطة هم !/ /:دصاغط)» 
ومستشار الرحلات (012ع1]085://1087710.61152051501:2)؟ وتلك التي تسعى إلى حل واحد 
أو أكثر من الجمهور على سبيل المثالء» إتوسنتف (حتامء.ع كتأجاع» محتطة.710717؟/ /:وصاخط/): 
واملتقيات المكثفة مطوري البرمجيات (235مطغهءء112). 


وبخصوص النوع الأول أصبح إنتاج المعلومات (خريطة مفتوحة المصدرء موسوعة قابلة 
اليد ولو الؤضتبول النها يدا با ) قدا وكيا افضماد من إنتاج الأفراد. مع إعطاء المشاركين 
الحقوق والتسهيلات لتعديل وتنقيح وإسهاب الشرح لمساهمات الآخرين (7علكلمء8 
6).. فمن خلال العمل عبر شبكة الإنترنت يمكن لأي أحد له قدرة النفاذ إليها من أن 
يسهم ويضيف إلى مجمّع الخبرات المحتملة ونطاق المشاريع مقابل تكلفة أقل. وضمان 
ممارسة مختلف وجهات النظر والتقنيات على المشروع (2011 ءع18ءطصاء11). وفي الواقع. 
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ممكنات البيانات الكبيرة ومصادرها 


فإن إنتاج خريطة مفصّلة للعالم أو موسوعة شاملة مع عدد قليل من اللهنيين هي مهمة 
صعبة ومكلفة. وببساطة شاقة للغاية بالنسبة لمجموعات صغيرة من المتطوعين. ولكن 
بالنظر إلى آلاف المشاركينء يمكن تجزئة المهمة عليهم وحلها. وسيكون المقابل الذي سيجنيه 
ا مشاركون هو إنتاج بيانات مفتوحة المصدر خالية من حقوق الطبع والنشر والرخص 
المكلفة (كما هو الحال مع بيانات الوكالة الوطنية لرسم الخرائط) (صندكء:ة1 له ء12008 
3. وبالمثلء يمكن لشركة أمازون وغيرها من شركات التجزئة على الإنترنت, من خلال 
تمكين المستخدمين من استعراض المنتجات التي يشترونهاء استخدام قوة الجماهير ل مراجعة 
ومشاركة آرائهم حول هذه المنتجات. كما أن الفائدة التي تعود على المشاركين هي تبادل 
الرأي فيما يتعلق بالمزايا النسبية للسلع والخدمات. 

ويعد استخدام المسابقات لتحفيز الجماهير على اقتراح حلول مقابل جائزة من أشكال 
التعهيد الجماعي الخاصة والذي تستخدمه بعض الشركات لتقديم الخبرات والأفكار 
(2011 تتعونءطصتء]111). قعوضا غيق اللجوء للمناقصات والاستعانة مجموعة محدودة من 
الخبراء المحتملين. تفتح شركات مثل إنوسنتف (عكنغطءء20م1) وتوب كودر (72ع000م10) 
المشكلة من خلال الإعلان عنها لأي شخص مهتم, وتقدم في العادة من عشرة آلاف إلى مئة 
الوؤولان ولعيانا أكازميق ذلك وكسن أكيداك شاول: نا كل اماق .وفع حكوق جهو 
هو مصدر الحلء ولكن لا يعمل الأفراد بعضهم مع بعض بشكل جماعيء وتكون الفائدة 
بالنسبة للشركات هي خيارات الحل المقدمة وللمشاركين هي العائد المالي إذا تم اختيار 
الحل الخاص بأحدهم. وعلى نحو مماثل. تسعى مسابقات بيانات التطبيقات المفتوحة 
التي تعقدها المجالس البلدية إلى تقديم مكافآت أكثر تواضعاً مقابل تطبيقات أكثر فائدة 
وإثارة للاهتمام. ويمكن لهذه المسابقات أن تأخذ شكل الملتقيات المكثفة لمطوري البرمجيات 
(121850055]) التي يعمل الناس فيها معاً في فرق لتطوير حلول تطبيقات, وعادة ما 
تمتد على مدى يوم أو خلال عطلة نهاية الأسبوع. وتتمثل الفائدة العائدة على البلدية في 
استخدام بياناتها من أجل الصالح العامء وشهرة المواطنينء والمشاركة المدنية. 
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الفصل الخامس 


علم المواطنة (عع مع ك5 2مع1)125)): 
علم المواطنة هو شكل من أشكال التعهيد الجماعي حيث تعمل مجتمعات أو شبكات 
من المواطنين بصفة مراقبين في بعض مجالات العلوم (218 :2007 14نطاء6000). هناء 
يقوم الناس بإنتاج وإعداد ومعالجة الملاحظات العملية التجريبية» والقياسات التفصيلية 
للظواهر بالمجانء والتي تعد. حاسمة ومفصلية. وذات قيمة حقيقية كنقاط بيانات للعلوم 
الصحيحة. ويكون علماء المواطنة ذوي فائدة بشكل خاص من حيث الرصد لأنهم قد 
يكونون موزعين جغرافياً ومُدرجِين ضمناً في المكان عبر الزمن حيث من الصعب على 
مستويي التنسيق والتكلفة استخدام مساعدي البحوث المهنيين لجمع القياسات الميدانية. 
ومن الأمثلة على ذلك. قياسات هواة الرصد الجوي الناتجة من محطات الحدائق الخلفية 
للأرصاد الجوية. وهواة علم القلك الاين يراقرؤق السياء لبلا بدقة. وقد أصبح علم المواطنة 
راسخاً خلال القرن العشرين: وذلك دعماً لرواج العلم وتعميمه. ولكن لا يزال النشاط ضئيلاً 
ويعتمد على درجة معقولة من المهارات وا معارف وال معدات المتخصصة مثل مرقاب ذي 
نوعية جيدةء وفوق ذلك قدر كبير من التحفيز والالتزام ا مستمرين. 
وقد صف (2012 .21 اه عوصنطود2111162-1 صذ 4عنك :2009 21 ه بإعصده8). أشكال 
علم المواطنة في ثلاث فثات: 
« التساهمية (7إ00261511601©): وتصمم بشكل عام من قبل العلماء ولأجلها يسهم الأفراد 
عامة بالبيانات في المقام الأول. 
« التعاونية (00113601861576): وتصمم بشكل عام من قبل العلماء ولأجلها يسهم الأفراد 
عامة بالبيانات» ولكن قد يساعدون أيضا على تحسين تصميم المشروع, وتحليل البيانات, 
ونشر النتائج. 
« الإنشاء المشترك (00-5:62]60): وتصمم من قبل العلماء وأعضاء من عامة الجمهور 
يعملون معاً ولأجلها يتم إشراك بعض عامة المشاركين على الأقل في معظم أو جميع 
خطوات العملية العلمية؛ ويشمل ذلك أيضا البحوث التي وضع تصورها وتم تنفيذها 
من قبل علماء هواة (غير مهنيين) بشكل كامل. 
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العلماء فقط من ذوي ال مهارات الأكثر تقدما في مشاريع الإنشاء المشترك. ويمكن أن تتخذ 

المشاركة عددا من الأشكالء بما في ذلك: 

« الحوسبة الموزعة: حيث يضيف أحد المشاركين قوة معالجة حاسوبية من أجهزة الحاسب 
الشخصية الخاصة به إلى المشروع» مما يسمح بمعالجة البيانات باستخداء الموارد 
الحاسوبية منها (التساهمية). 

« النسخ / التحويل / الرقمنة: تحويل شكل من أشكال البيانات إلى آخرء على سبيل اللثال» 
تحويل وثائق مكتوبة بخط اليد إلى نص رقمي (التساهمية). 

٠‏ قياسات الرصد: ينتج العلماء البيانات. ولكن يستخدم علم المواطنة لإجراء القياسات 
باستخدام أدوات محددة يجري توريدها لهم (التساهمية). 

٠‏ جمع البيانات: يجمع أفراد المواطنين البيانات ومن ثم يقومون بمشاركتها مع العلماء 
(التساهمية). 

٠‏ تحليل الرصد: يقوم أفراد المواطنين بإجراء بعض التحليلء بما في ذلك توفير بعض التفسيرات 
ما قد تعنيه النتائج» بدلا من مجرد الاكتفاء بإنتاج أو قياس البيانات (التعاونية). 

٠‏ تصميم | لبحث وتشغيله: يقوم أفراد المواطنين بدور نشط في تصميم وتشغيل المشروع, 
فضلا عن نشر النتائج والاستنتاجات (الإنشاء المشترك). 


(2013 أمتخصمعك5 معم0) 


الخلاصة: 

تطرّق هذا الفصل إلى العوامل المساعدة للبيانات الكبيرة ومصادرها. وتم بيان أن إنتاج 
البيانات الكبيرة قد تيسّر بفضل التقاء خمسة ابتكارات تقنية من بداية الألفية الجديدة 
فصاعداً وهي تنامي قوة المعالجة الحاسوبية, وكثافة التشبيك الحاسوي, والحوسبة المنتشرة 
والحوسبة في كل مكان, والتعرّف وتحديد الهوية من خلال زيادة قابلية الفرز والقراءة آلياً 
وأخيراً التخزين الموزّع الواسع النطاق. وقد أدّت هذه التطورات مجتمعة إلى مجموعة 


ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة, والبنى التحتية للبيانات, والنتائج المترتبة عنها مل 


الفصل الخامس 


متنوعة من النظم الاجتماعية التقنية التي تنتج البيانات الكبيرة. وقد قدّم هذا الفصل 
مسار تتبّْع أولي لهذه الأنظمة. حيث قسّمها إلى ثلاث فئات واسعة النقاط من أشكال إنتاج 
البيانات: الموجهة. والآلية» والتطوعية. وينبغي النظر إلى مثل هذا ال مسار باعتباره خطوة 
أولية في محاولة وضع خريطة لمشهد يتكشّف باستمرار. وما هو مطلوب حالياً يتمثل في 
مجموعة مفصّلة من الدراسات التجريبية التي تدرس بشكل أكثر عمقاً الطرق المختلفة التي 
يتم بها حالياً إنشاء ومعالجة واستخدام البيانات الكبيرة. كما تحتاج مثل هذه الدراسات 
إلى رسم أصول التقاء هذه التقنيات الممكنة وفك مجاميع البيانات التي تم أنشاؤها وكيف 
تطبق عمليا لإنتاج أشكال معينة من البيانات الكبيرة (انظر الفصلين 1 و11). وهذا يشمل 
تفكيك عناصر النظام المرتبط بها (انظر الفصل 7). وعند القيام بذلكء يمكن الحصول على 
أفكار ورؤى أكثر عمقاً لكل نظام اجتماعي تقني ولمختلف العمليات والضوابط والسياسات 
المتصلة به. والعمل المتنوع الذي يقوم به في هذا العاط. 

كما ينبغي لمجموعة مصاحبة من الدراسات أن تختبر ما قد يحدث عند ربط 
النظم الاجتماعية التقنية معاً لإنشاء أنظمة جديدة أكبر والتي من خلالها تنتج الآثار 
الهامة لتضخم البيانات. كما أن التقنيات التي تقوم عليها البيانات الكبيرة» والبيانات 
نفسها من خلال علائقيتهاء هي أيضاً جاهزة لمثل هذه التوسعات. في الواقع. تكون 
مجاميع اجتماعية تقنية (2121اءع50010-1) معقدة. مثل سلسلة متاجر التجزئة 
الكبيرة كوولمارت (امهدملة18), تقوم وعلى نحو متزايدء بربط العديد من الأنظمة 
مثل إدارة سلسلة التوريد (2122286132626 تقطن 7إ1مهمن5). تخطيط موارد 
امؤسسات (ع728تصططة]2 عع ن1ناهوع1]1 ع115م#عاص8). إدارة علاقات العملاء (1ع 2م1156 
ع عع 1/1222 «منطقطه6ج121).: إدارة المخزون ()«عميععهصه]3 ع:ه56): وأنظمة 
الأمن (05دع]5(75 تأتدتءء5) والتي تنتج أشكلاً من البيانات الموجهة. والآلية. والتطوعية 
لإنشاء منظمات معقدة ومتطورة موجهة بالبيانات والتي تترتب عليها آثار متنوعة على 
الموردين والموظفين والمستهلكين. وبامثلء تحاول مراكز السيطرة والتشغيل للمدن 
الذكية دمج أنواع مختلفة من البيانات التي تم جمعها من مصادر مختلفة في مركز 
واحد حيث يتم الجمع بينها وتحليلها بشكل آني أو لحظي (©8621-152). مما يغيّر 
بشكل جذري الطريقة التي تدار وتحكم بها التجمعات المدنية (انظر الفصل السابع). 
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ممكنات البيانات الكبيرة ومصادرها 


وقد أثار مثل هذا التوسع وإعادة الضبط العديد من الأسثئلة الاجتماعية والسياسية 
والأخلاقية والمعيارية المتعلقة بأنواع الأنظمة والأماكن التي نريد العيش داخلهاء وقد 
بدأنا بالكاد أن نسأل ونجيب عن هذه الأسئلة (انظر الفصل العاشر). 
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آليات تحليل البيانات (42217715 12264) 


ليست البيانات بحد ذاتها مفيدة: كما أنها ليست ذات فائدة إلا إذا أمكن استخلاص 
معنى وقيمة منها. وبعبارة أخرىء فإن ما يمكن فعله حيال البيانات هو أمر أهم من مجرد 
عملية إنتاجها؛ إذ ترتكز جميع العلوم على تحقيق معنى وقيمة من البيانات. إن إيجاد 
واستشعار ا معنى من البيانات الصغيرة الموسعة والبيانات الكبيرة ينطوي على تحديات 
جديدة. ففي حالة البيانات الصغيرة الموسعة: يكمن التحدي في ربط قواعد البيانات 
المتنوعة للحصول على رؤى جديدة: وانفتاح البيانات لتقبّل ا مناهج التحليلية الجديدة 
التي يجري استخدامها مع البيانات الكبيرة. أما بالنسبة للبيانات الكبيرة. فيتمثل التحدي 
في التكيّف مع الوفرة والشمولية (متضمناً ذلك الكميات الكبيرة من البيانات ذات الفائدة 
والقيمة المنخفضة). والمناسبة الزمانية والديناميكية. والفوضى وعدم اليقين» والعلائقية 
العالية. والطبيعة شبه ال منظمة وغير المنظمة: وحقيقة أن يتم إنتاج الكثير من البيانات 
الكبيرة دون أي سؤال محدّد في العقل لتجيب عنه أو أنها في صحبة منتج هو نتيجة ثانوية 
لنشاط آخر. فالواقع» وحتى وقت قريبء تم تصميم تقنيات تحليل البيانات بشكل أساسي 
لاستخلاص رؤى من مجموعات بيانات شحيحة: وثابتة. ونظيفة. وضعيفة العلائقية.ء وجرى 
جمعها بطرق علمية وملتزمة بافتراضات صارمة مثل الاستقلالية: والثبات» والعيارية, كما 
جرى إنتاجها وتحليلها مع وضع سؤال محدد في الاعتبار (2010 1/1111 .[.81). 

حتى وقت قريب كان تطوير أدوات للربط بين مجموعات البيانات المختلفة وتحليل 
البباتات الكبيرة فعيفاة سعين التعقيه اللرقظ يتطوبر هذه الأدوات مسن الناضية 
الحاسوبية. وم يجر تحليل مجموعات البيانات الضخمة بشكل منتظم سوى في السنوات 
الأربعين الماضية أو نحو ذلك. وحتى ذلك الحين كانت هذه التحليلات قائمة على مبادرات 
خاصة قادرة على تحمّل الوارد اللازمة. وبدون طاقة حاسوبية عالية واسعة الانتشار 
ويمكن النفاذ إليها. سيكون إيجاد واستشعار المعنى من طوفان البيانات الهائل مكلقًا 
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للغاية أو صعب التطبيق ويستغرق وقنًا طويلا. وبالطبع» هناك نوج ما من الجدل الدائر 
في الواقع هنا؛ إذ دون الحوسبة الواسعة الانتشار في كل مكان لم يكن إنتاج البيانات الكبيرة 
ليكون في المقام الأول. ومع ذلكء كما ذكر (1< :2009) .21 © 125616], فإنه بالنظر إلى 
«ظهور الحواسيب وعصر ال معلومات, فقد تفاقمت المشاكل الإحصائية من حيث الحجم 
والعقيد». 


وتمثل الحل لتحديات معالجة وتحليل البيانات الصغيرة الموسّعة والبيانات الكبيرة 
بمجموعة جديدة من آليات إدارة ال معلومات والتخزين (انظر الفصل الخامس) وتطوير 
أدوات تحليل البيانات الكبيرة. فمنذ بداية الحوسبة استمرت هذه الآليات والأدوات 
التحليلية الجديدة في التطورء وهي تقوم على اختبارات إحصائية» ونماذج. وأساليب تمثيل 
صوري رصينة متبعة» كما أنها تعمل على إنشاء أساليب وطرق جديدة تضرب جذورها 
في البحوث المتعلقة بالذكاء الاصطناعي والأنظمة الخبيرة التي هدفت إلى إنتاج تعليم 
الآلة بحيث يممكنها حاسوبيًا وبصورة تلقائية التنقيب. والكشف عن الأنماطء وبناء النماذج 
التنبئية. فمثل هذه الأدوات التحليلية أضحت ملائمة وبشكل مثالي في معالجة واستخلاص 
ا معلومات من مجموعات بيانات ضخمة ومتصلة ببعضهاء فقد أصبحت تشغل حيرا 
كبيراً من الاستثمار في البحوث من أجل توسيع وإنتاج طرق معالجة جديدة للبيانات 
والخوارزميات الإحصائية والنمذجة وتقنيات التمثيل الصورية (ال مؤسسة الوطنية للعلوم 
2 80112013105 ععمعك5 2130221). وتسعى هذه الأدوات التحليلية: كما هي 
مطبّقة في مجال الأعمال التجارية والعلوم: للإجابة عن أربع مجموعات أساسية من 
الأسئلة (2013 .21 )»© 1[اعصن/3): 


الوصف (106501156102): ماذا ومتى حدث ذلك الشيء؟ وكم مرة يحدث؟ 
« التفسير (1323610م:1): لماذا حدث ذلك؟ وما هو تأثيره؟ 
« التنبؤ («ه1]ء6:1): ماذا بممكن أن يحدث بعد ذلك؟ وماذا لو فعلنا هذا أو ذاك؟ 


٠‏ العلاج (دهنامنوءم05): ما الحل أو النتيجة الْمُثْلى؟ وكيف يمكن تحقيق ذلك؟ 
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وتستمد الإجابة عن هذه الأسئلة من أربع فئات رئيسة من آليات التحليل: التنقيب عن 
البيانات والتعرّف على الأماطء التمثيل الصوري للبيانات وآليات التحليل البصرية: التحليل 
الإحصاي, والتنبؤ والمحاكاة والتحسين. وسيتم مناقشة كل من هذه الفئات باختصارء ولكن 
ينبغي تقديم مرحلة ما قبل التحليل وتعلّم الآلة أولاء لأنها مركزية لجميع الفئات الأربعة. 


ما يسبق التحليلات (5ع2[197)1مد-ء:2): 
تحتاج كل تحليلات البيانات إلى أن تكون البيانات المطلوب تحليلها معدّة سلفًا للتحليل؛ بمعنى 

أنه قد جرى تجهيزها والتحقق منهاء. وقد بين (2011) .لهاء صداع لص (2010) 8111 .181.1 

أربع عمليات فيما يتعلق بالبيانات المومّعة والكبيرة والتي تطبّق عادة بالتسلسلء على الرغم من 

أنه لا يلزم تنفيذها بأي ترتيب معينء إضافة إلى إمكانية تكرار تنفيذها: 

« اختيار البيانات (0هء5616 108]8): تحديد مجموعة حزتثية من المتغيرات الأكثر قيمة, 
وإطار العينة المحتمل لهذه المتغيرات. حيث لن تكون كل المتغيرات الناتجة ذات 
أهمية. ولا بالضرورة كل نقاط البيانات, فإدراج مثل هذه البيانات غير الضرورية في 
نماذج قد يولد التكرار وعدم الكفاءة. 

٠‏ امعالجة السيقة للبيانات (655128ع10م-716 1028): تنظيف البيانات ا مختارة لإزالة 
الضوضاء أو الأخطاء أو التحيّزء أو التعامل مع الحقول المفقودة أو التناقضات وعدم 
السلامة. وهيكلة البيانات لإدخالها في عملية التحليل. 

« اختزال البيانات وإسقاطها (دمناءءزه:م 4صه دمنء »+ :122): التقليل من أبعاد 
البيانات من خلال التحويلات (على سبيل المثالء التسوية والصقل (عصنطغههحمطة). 
وبناء السمات والخصائص, والتجميع, والتطبيع» والتسلسل الهرمي للمفهوم, والأساليب 
الإحصائية مثل تحليل مستوى الانحدار وتحليل المكونات الرئيسية) لمكافأة تمثيل 
البيانات ولكن بصورة أكثر كفاءة. 

٠‏ إثراء البيانات (626<تاءتمء 1(8): دمج البيانات المختارة مع بيانات أخرى (مثل 
بيانات التعداد السكاني وبيانات السوق) من أجل الوصول إلى رؤى يمكن الاستفادة منها 
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فمن جية. صَمّمت كل خطوة من هذه الخطوات من أجل زيادة نوعية البيانات 
ال ممستخدمة في التحليلء ومن جهة أخرىء باستثناء إثراء البيانات. من أجل تقليل حجم 
البيانات التي على التحليل التعامل معها. فالأول تم تصميمه لتعزيز صحة وصلاحية 
الاستنتاجات المستخلصة بالنظر إلى الفوضى الكامنة وعدم اليقين في البيانات الكبيرة (انظر 
الفصل التاسع). في حين يهدف الثاني إلى زيادة الكفاءة التشغيلية مع الأخذ بعين الاعتبار 
أحجام البيانات وسرعاتها والأحمال الحاسوبية. ومن الممكن أن يكون من الصعب القيام 
بهذه المهام عند إجراء التحليلات بشكل آني أو لحظيء وخاصة فيما يتعلق بتنظيف البيانات. 
ونتيجة لذلكء وفيما عدا التمثيل الصوري للمؤشرات» لا يجري تحليل البيانات الكبيرة آنياً 
أو بشكل لحظيء ولكن يجري التحليل على سلاسل تمثل عينات كبيرة جدًا لبيانات نظيفة, 
ومختزلة, ومخصّبة (ثرية) وخلال أزمان مختلفة. أما إذا كان المطلوب تحليلات بشكل آني 
أو لحظيء فتطبّق في العادة التحليلات المسبقة للبيانات مقدمًا على عينة من أجل تحديد 
طبيعة البيانات وكيفية التعامل معها للانتقاء. والاختزال» والتنظيف على عجل. 


ويعد إثراء البيانات مهمة ذات قيمة عالية لأنها تنتج أثرًا مضكيا (.21 أء امام هون 
2) ممكن من اكتساب رؤى لا يمكن الحصول عليها من خلال قاعدة بيانات واحدة. 
وبحسب من تمت مناقشته في الفصل الثانيء فإن اللىمبرر الرئيسي لإنشاء البنى التحتية 
للبيانات تمثل في إعادة استخدام البيانات. وإن التحدي يتمثل في إنشاء طرق لربط البيانات 
التي أنتجت لأغراض مختلفة بعضها ببعضء والتي قد تختلف أيضا في البيانات الوصفية 
ا مصاحبة لهاء ومعايير البيانات. ووحدات القياسء والإجراءات» والفئات. والنطاقء والتزامن» 
وتنسيقات ال ملفات, أو إنشاء طرق للربط لتقليل حدوث المغالطات ال محتملة الناتجة عن 
الاستدلال (وع121121 [هءأع10مء 26121ءغ20 01 <من)جءع01). وهذه ليست مهمة يسيرة. 
ولكن تعمل الأساليب الحاسوبية على جعلها أسهل من خلال استخدام الخوارزميات التي 
يمكنها البحثء المطابقة, الدمج. إعادة الجمع من خلال أنواع مختلفة من التحولات, وإعادة 
تهيئة البيانات. وبالنتيجة: يمكن التنقيب والتحليل في مجموعة بيانات جديدة باستخدام 
الفئات الأربع الرئيسية للتحليلات التي سيجري نقاشها أدناه. 
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ويمكن أن تكون أعمال التحليلات المسبقة مملّة باستغراقها وقنًا طويلاً للغاية» ولكنها 
مع ذلك مهمة جدًا ولا يمكن تجاهلها. وبالنظر إلى الزيادة المنقطعة النظير في مختلف 
أنواع البنى التحتية الجديدة للبيانات والبيانات الكبيرة» فقد أصبحت منطقة ثرية للبحث 
حيث يسعى علماء البيانات إلى إيجاد طرق أكثر إنتاجية وكفاءة وفعالية لإتمامء وخصوصًا 
أتمتة. هذا العمل. 


تعليم الآلة أو التعلم الآلي (وستصعدع1 عصنطعد]8): 

يمكن إجراء تحليل الأعداد الكبيرة جدًّا من سجلات البيانات في إطار زمني مناسب عن 
طريق الخوارزميات الحاسوبية. وفي حين أن الكثير من عمليات تحليل البيانات الكبيرة 
يمكن إجراؤها بالطرق نفسه المتبعة في تحليل البيانات الصغيرة. حيث يتخذ المحللون 
القرارات المتعلقة بالكيفية التي يتم فيها الاستكشاف من خلال هذه الخوارزميات» فإن 
الهدف من أغلب البحوث هو تطوير عمليات مؤتمتة ممكنها تقييم البيانات والتعلم منها منها 
ومن تحليلها. ويطلق على هذه العمليات المؤتمتة مصطلح تعلم الآلة أو التعلم الآلي 
وتشكل أحد فروع الذكاء الاصطناعي. ويهدف تعلم الآلة إلى التطوير التخرو لفهم 
مجموعة البيانات؛ والتعلم التلقائي لإدراك أنماط معقدة وبناء نماذج توضح وتتوقع مثل 
هذه الأنماط؛ وتحسين النتائج (2011 .21 اء 122]]). 


ويتكون تعلم الآلة بشكل عام من نوعين رئيسيين: مُراقب لامتكا بيانات التدريب) 
وغير مراقب (باستخدام التنظيم الذاي). في التعلم المراقب» يتم تدريب نموذج لمطابقة 
مكلت مع مغيجات تحلوفة. عانق سيول اللغالن: مكل لومي التموذج الظايقة الرموة 
البريدية المكتوبة بخط اليد مع مثيلاتها المطبوعة آليّه أو التنبؤ بنتائج معينة, فهي «مراقبة» 
بمعنى أن بيانات التدريب موجودة لتوجيه عملية التعلم (2009 .6621 1135816). في المقابل, 
تسعى نماذج التعلم غير الخاضعة للرقابة إلى تعليم نفسها على اكتشاف الأنماط وإيجاد هياكل 
البيانات دون استخدام بيانات التدريب. وبشكل عام يمكن تحقيق ذلك من خلال تحديد 
مجاميع وعلاقات بين البيانات التي لم يكن معروفًا بينها مسبقًا خصائص للتشابه أو الارتباط. 
فعلى سبيل المثالء يمكن أن يتعلم النموذج على كيفية تقسيم العملاء إلى مجموعات ذاتية 
متمائلة والتنبؤ بالمشتريات لتلك المجموعات (2011 .21 )© 2ةة8). في كلتا الحالتين» يتم 
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إنشاء نموذج من خلال عملية التعلم التي شكلتها القواعد والأوزان التي توجه كيفية بناء 
نموذج فيما يتعلق بالبيانات (2009 .21 )© 1125616). وتبدأ عملية بناء نموذج من بناء بسيط 
ثم يتم التعديل مرارًا وتكرارًا على ذلك البناء باستخدام قواعد التعلم, بالمثل كما يُطبق مع 
الطفراتٍ الجينية» إلى أن يتطور البناء إلى نموذج قوي (122 :2013 [اعوعغ51). وهناك شكلان 
للتعلم المراقب غير المراقب وهما التعلم فية الراقك الذي يشمعمل عان استخدام كل من 
التدريب والبيانات التي لا تحمل عناوين (وهي البيانات التي يمكن الحصول عليها بسهولة 
ولكنها غير مسماة كالصور والتسجيلات الصوتيةء والفيديوء المقالات الإخبارية» وغيرها من 
البيانات الخالية من أي ملصقات تتيح التعرف عليها بشكل أكبر). والتعلم النشط الذي يتيح 
للمستخدمين القيام بدور نشط في توجيه نموذج التعلم (2011 .21 © 11285). 


وقد جرى استخدام التعلم الآلي في جميع عمليات تحليلات البيانات الكبيرة الأربع. 
على الرغم من أن هذه التحليلات ليست مقتصرة في عملها على هذه الطريقة. ويتم 
إجراؤهاء في كثير من الحالات, من قبل الباحث بشكل مباشرء وحتى ضمن التعلم الآلي 
يبقى المحذل ودورة مهما في الحكم على العملية وتوجيهها وتقييم النتائج الوسيطة. وكما 
لاحظ (2010) 3011165 .51.1 فإن التعلم الآلي ليس مجرد علم تلقائي وسهل المنال. بل 
سطلنى غيرة بالجال وفك عميننا: وهي المهارات التي لا يزال العقل البشري أفضل بها من 
أجهزة الحاسب الآلي. وبينما تم إحراز تقدّم كبير في تطوير تقنيات التعلم الآلي» فإنه لا 
يزال من العلوم الناشئة التي مازالت بحاجة إلى الكثير من البحث لتحسين فعالية ومتانة 
النماذج المنتجة. 

وفيما يليه سيتمٌ مناقشة كل فئة من فئات التحليلات الرئيسية على حدة: على الرغم 
من أنه تجدر الإشارة إلى أنها غالبًا ما تستخدم جنيًا إلى جنب. على سبيل اللثال ينبغي أن 
يوفر التنقيب عن البيانات والتعرف على الأنماط أسس التنبؤ/التوقع أو التحسينء ويمكن 
استخدام الإحصاءات في التنقيب عن البيانات للكشف عن الأنماط أو في حساب التوقع/ 
التنبؤ وقد يستخدم التمثيل الصوري في التنقيب عن البيانات» أو لتحصيل المخرجات من 
أنظمة المحاكاة... إلخ. 
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التنقيب عن البيانات والتعرّف على الأنماط (ده )تمع مءع2 صنء )6د سه عسنصن31 4د12): 

التنقيب عن البيانات هي عملية استخلاص البيانات وأأنماط من مجموعات البيانات 
الكبيرة (2011 .21 غ» 31227318). ويقوم التنقيب عن البيانات على مفهوم امتلاك كل 
مجموعات البيانات الضخمة معلومات مفيدة ذات معنى على صورة غير عشوائية. وذات 
صلاحية سارية المفعولء وقابلة للرواية» ومفيدة. ومفهومة في نهاية المطاف ()» 1125 
1 .1). وبالمثلء يستخدم التعلّم الآلي المراقب وغير المراقب للكشف والتصنيف 
والتقسيم عن العلاقات والارتباطات والاتجاهات ذات المغزى بين المتغيرات. وهي تقوم 
بذلك باستخدام سلسلة من التقنيات بما في ذلك معالجة اللغات الطبيعية. والشبكات 
العصبية. وأشجار اتخاذ القرارء والأساليب الإحصائية (دون معاملات وذات المعاملات). 
وتختلف طريقة الاختيار بين نوع البيانات (المنظمة: وغير المنظمة. وشبه المنظمة) والهدف 
من هذا التحليل (انظر الجدول ١‏ -1)). 

الجدول رقم ١(‏ -5) 
مهام وأساليب التنقيب عن البيانات 
مهمة التنقيب عن البيانات 


التجزئة أو التجميع تحديد قائمة من ا مجموعات التحليل العنقودي (وزةترلهصة يعاوسسان) 
(01 21012 مع و5 الضمنية التى تصف البيانات 
كسمتعاكتات) 


التصنيف (002غهء0125516) التنبؤ باسم الفئة التي تنتمي تصنيف النظرية الافتراضية 
إليها مجموعة من البيانات 
استنادا إلى بعض مجموعات 


(دم تدع 12551ب سهزوعتروه 8) 
بيانات التدريب. استقراء شجرة القرارات 
(حمتاعن ص1 عع ]' ممزونء12) 
الشبكات العصبية الذكية 
(5ك1:1هاع[8 لدتتاعءلك 21 نمم ) 
آلة دعم التمييز 


(عصتطاع هط جمعءء؟7؟ امم منا5) 
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الفصل السادس 
الربط (2مغهكء4550) إيجاد روابط بين كائنات 
البيانات؟ التنبؤ بقيمة بعض 
الحقول بالاعتماد على قيمة 
حقول أخرى 


الانحراف (7126602ع12) إيجاد عناصر البيانات 
ا معرضة للانحراف عن 


المتوقع 


الاتجاهات (05دع11) الاتجاهات والمنحنيات التي 
تلخص قواعد البيانات. عادة 


عبر الزمن 


التعميم (662612112880) 1 دمج مواصفات البيانات 


المصدر: 2009:7) طوآط لصه 1ة3/1111) 


قوانين الارتباط 


(وع1نكآ امتكهكءوووم) 


تصنيف النظرية الافتراضية 
(م6وع6 019551 مهلوع :09 8) 
التحليل العنقودي 
(15ستولفصكى تتعاوسات) 
كشف الانحراف 
(ممتاءعكء0آ تع ناد 0) 
تحليل التطور 
(97515أدصخ ده ناجام؟8]) 
الاتحدار (دماووعميوع1]) 
استخلاص تسلسل النمط 
(حامتاع هاعد متاعغوط عع معناوء5) 
القواعد والقوانين الموجزة 
(5ع111كآ 2177 لصصطناك) 


الاستقراء اموجه بالسمات 
(حه نع تك ص1 لعغمع011- عاط تنام ) 





إن معظم الآليات المدرجة في الجدول (6-1) تتصل بالبيانات المنظمة كتلك الموجودة في 
قواعد البيانات العلائقية. على سبيل المثال» من الممكن تطبيق نماذج التجزئة على قواعد بيانات 
عملاء التجزئة ومشترياتهم لتقسيمهم بحسب معرّفات مختلفة بالاعتماد على خصائصهم 
وأنماط سلوكهم من أجل تقديم عروض/ خدمات مختلفة لكل مجموعة مختلفة. وفي تحليل 
الشبكات الاجتماعية يمكن تحليل الروابط بين الأفراد لفهم المتغيرات الاجتماعية وكيفية تدفق 
المعلومات فيما بينهم. وفي كشف الارتباطات, يمكن استخدام مجموعة متنوعة من نماذج 
الانحدار في الكشف عن الروابط لحساب الاقترانات بين المتغيرات, ومن ثم الكشف عن الأنماط 
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الخفية التي يمكن الاستفادة منها لتحقيق مكاسب تجارية (على سبيل المثالء تحديد ما يتم 
شراؤه كوحدة من البضائع وإعادة تنظيم المخزون لتعزيز الشرائية) (انظر الفصل السابع). 

وثثير البيانات غير المنظمة» والتي تكون على شكل نصوص أو صور أو أصواتء تحديات 
خاصة فيما يتعلق بالتنقيب عن البيانات. فآليات معالجة اللغات الطبيعية تهدف إلى 
تحليل اللغة الإنسانية التي يجرى التعبير عنها من خلال الكلمة المكتوبة والمنطوقة. وهي 
تستخدم دلالات وتصنيفات من أجل التعرّف على الأنماط واستخراج المعلومات من الوثائق. 
وتشتمل الأمثلة على استخراج العنصر الذي يستخرج البيانات الوصفية من النص بصورة 
تلقائية من خلال البحث عن أنواع معينة من النصوص والتعابير. مثل أسماء الأشخاص 
والمواقع والتواريخ وال لمصطلحات التخصصية والتراكيب المنطقية؛ واستخراج العلاقات التي 
تحدّد تلقائيًا العلاقات بين العناصر الدلالية. وربطها معًا (على سبيل المثالء اسم الشخص 
وتاريخ ميلاده أو مكانه أو رأيه ببند ما) (2009 7إ23ع721602). ومن التطبيقات النموذجية 
لثل هذه الآليات التحليل الوجداني الذي يسعى إلى تحديد الطبيعة العامة للآراء وقوتها 
حول قضية ماء على سبيل المثالء ما يقوله الناس عن انتج على وسائل التواصل الاجتماعي. 
كما يمكن تعقب أماكن نشوء هذه الآراء باستخدام البيانات الوصفية الموضعية (صتهطه© 
3 .21 ]©) والتنقيب عن نشر المعلومات داخل وسائل التواصل الاجتماعي» على سبيل 
المثال» تبادل عناوين المواقع الإلكترونية الأكثر تفضيلاً ومشاركتها بين مختلف المستخدمين 
(2013 1256م ط[ط0). فهذه المعلومات مفيدة للشركات,ء مثل الوكالات الإعلانية. والمسوقين, 
والخدمات المالية والتي تسعى إلى الاستفادة من الاتجاهات الناشئة والوصول المنظم في 
الوقت المناسب (على سبيل المثال» لوضع إعلانات تتناسب مع الأحداث الجارية؛ لبيع وشراء 
الأمهم قبل ردة الفعل العنيفة للسوق). 


أما الصور فيتم إنشاؤها للتخزين والعرضء وليس للمحتوى والبحث (2013 :5ه طلط0). 
فكشف وتصنيف واستخراج أنماط داخلهاء مثل التعرف على الوجه أو مكانء ليس بالأمر 
السهلء ولكن يتم التعامل مع ذلك من خلال تقنيات الممسح التصويريء والاستشعار عن 
بعد ومعالجة الصور وتقنيات الاستبصار الآلية» متضمنا ذلك التعرف على الأشياء ومطابقة 
القالب باستخدام مجموعات التدريبء وطرق التجميع: والشبكات العصبية. وتتفاقم 
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الفصل السادس 


مشكةة التنقيب في الصور عند محاولة استخراجء ومقارنة» وفهرسة الأنماط لعدد هائل من 
الصور (2001 .21 ]© وصدط2). وبرغم أن التنقيب في الصور لا يزال من المواضيع الناشئة, 
إلا أنه أصبح أكثر تقدمًا في السنوات الأخيرة. فعلى سبيل المثال. فإن الموقع الإلكتروني 
على شبكة الإنترنت: (153869715102.6012//:م14) يدعي بأنه سيكون قادراً على تصنيف 
0 دقيقة من الفيديو في الساعة الواحدة. لكل خادم: وذلك باستخدام خوارزميات 
التعلم الآلي للكشف عن بعض الخصائص مثل العري وشعارات الشركات. 

التمثيل الصوري للبيانات وآليات التحليل الصورية (لطه ده1دد1لهسو؟ مند1 
15] لدم لددك1؟؟): 


شاعت مقولة تنص على أن صورة واحدة تغني عن ألف كلمة. وبالمثل» جرى استخدام 
السجلات البصرية لاختزال ووصف مجموعات البيانات من خلال ال مخططات والرسومات 
الإحصائية» والرسوم البيانيةء والخرائط» والرسوم المتحركة. وتكشف هذه الأساليب البصرية 
وتوصل على نحو فعال هيكل المتغيرات» وأنماطهاء واتجاهاتهاء والروابط بينها. وبالنظر إلى 
الحجم الهائل للبيانات الكبيرة وسرعتهاء فليس من المستغرب إذا أن التمثيل الصوري قد 
صار وسيلة شعبية لاستشعار البيانات وإيصال هذا الشعور. 

ويمكن استخدام التماثيل الصورية الناشئة ضمن عام التقنية الرقمية للتنقل والاستعلام 
عن البيانات» مما يتيح للمستخدمين الحصول على لمحة عامة عن كامل مجموعة البيانات, 
بالتركيز على البنود المهمة» واستبعاد البيانات غير المهمة» واختيار عنصر بياني أو مجموعة 
من البيانات والحصول على مزيد من التفاصيلء وعرض العلاقات بين العناصرء واستخراج 
مجموعات فرعية من التفاصيل عند الحاجة (1996 51610»11232). وعند عمل ذلك. يمكن 
الكشف عن خصائص وبنية مجموعات البيانات» وأكثر من ذلك يمكن استخدامها لتوضيح 
وفهم النماذج ومجموعات البيانات المعقدة التي يتعذر تمثيلها بطريقة مجردة وواضحة 
ومفهومة (مثل الظواهر الذرية» والظواهر الفلكية الثلاثية الأبعاد)» ورسم عشرات الآلاف 
من نقاط البيانات للكشف عن البنية» والتجميعاتء والثغرات, والقيم الشاذة التي قد تظل 
بدلاً من ذلك مجهولة في الخفاء (1996 5هدمء14ءصط5). على سبيل المثالء استيعاب وفهم 
ملايين التغريدات على شبكة التواصل الاجتماعي تويتر ليست بمهمة سهلة. فيمكن للمرء 
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الحصول على فكرة تقريبية عن القصص أو المواضيع التي تبدو واعدة» ولكن الحصول على 
نظرة عامة وشاملة هي مهمة غاية في الصعوبة» وكيفية تغيّر التوجه على مستوى الجماهير 
والأماكن. فأحد الحلول يتمثل في رسم خريطة تغريدات موزعة جغرافيًا ومصنفة بحسب 
الميول والأهواء. وهو نهج جرى الأخذ به من خلال فريق عمل الموقع الإلكتروني (//:ماغط 
2668 لقد أنشؤوا عشرات الخرائط حول توجهات المواضيع والتغريدات, 
واشتمل ذلك على الشكل ١(‏ -1) والذي يعرض التوزيع الجغرافي لتغريدات التخوف من 
المثليين في الولايات المتحدة من يونيو 7٠١١7‏ م وحتى إبريل 7١١7‏ م. كما أنهم عرضوا 
محتوى موسوعة الويكيبيديا وجوجل بالنسبة لمواضع التوزيع الجغرافي حول العام. 

ويشيع استخدام التمثيل الصوري أيضًا ليكون وسيلة للمراقبة الآنية ا مستمرة لظاهرة 
ما بشكل آني أو لحظيء مما يتيح تعقب ورصد العديد من المتغيرات عبر الزمان والمكان» 
والمقارنة بينهاء وتحديد التغيير الحاصل. فلوحات التحكم والعرض (10256502105) 
للبيانات المتغيرة تكون غالبا معروضة على شاشات الحاسب الآلي في غرف التحكم الحديثة, 
وهي تلخص على نحو صوري الأنظمة المتغيرة باستمرار للمشغلين الآدميين مع سلاسل 
زمنية ورسوم بيانية وخرائط للكشف عن الأحداث (انظر ليك 2013 ع>31.آ. للمقارنة بين 
6" لوحة عرض). وعلى سبيل المثالء يمكن أن توفر البيانات من مختلف أنحاء نظام النقل 
خريطة لتدفق حركة ال مرور وتقارير الحوادث بشكل آني أو لحظي؛ أو مواقع الطائرات 
خلال مرؤرها غير منظقة ما (افظر الشكل 4-8 كيا قد توفرمياثات رادار الطقس خريظة 
لهطول الأمطار بشكل آني أو لحظي ومحاكاة للساعات القليلة الماضية. فمثل هذه البيانات 
الصورية لا تساعد ضباط إدارة حركة المرور والراصدين الجويين فقطء ولكن أيضًا المواطنين 
الذين يمكنهم الوصول إليها ومتابعة الأوضاع الجارية باستخدام الحاسب الآلي أو الهواتف 
الذكية وتبديل سلوكهم لتجنب طرق معينة أو التعامل بشكل مناسب مع المستجدات. 
ومثال على نموذج أولي للوحة تحكه خاصة ممدينة عامة تضم مجموعة من البيانات الآنية 
أو اللحظية عن الطقس., وتلوّث الهواء. ومعوّقات حركة مرور النقل العام» وتوافر الدراجات 
العامة ومستوى ارتفاع ا منسوب اطائي النهريء وارتفاع الطلب على الطاقة الكهربائية 
وسوق الأوراق امالية» واتجاهات التغريدات على شبكة التواصل الاجتماعي تويترء وتغذية 
كاميرات مراقبة حركة المرور تلك المعروضة في الشكل (7-8). 
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الفصل السادس 


الشكل رقم ١(‏ -5) 
التوزيع الجغرافي لتغريدات التخوّف من اللمثليّة في الولايات المتحدة الأمريكية 





امصدر: #لصطغط.صرمحط_عتمط/ع هط /مدع طمعاعطط /نحلء.10هططاستتتط.وت1ء 15 / /:مراخط 
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الشكل رقم ( -1) 
المواقع اللحظية لمسار الرحلات الجوية 





امصدر: /حتامء.202124 داع 17.111 / /:صاغط 


ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة» والبنى التحتية للبيانات, والنتائج المترتبة عنها 


15 


الفصل السادس 


الشكل رقم (5 -5) 
لوحة معلومات مدينة لندن الخاصة بالمركز البريطاني للتحليل العمراني المتقدم 
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استخدام مجموعة أدوات التحليلات الجغرافية 


الصورية في بناء الرواية الة 


4 


4 


ة الجماعية 


الشكل رقم 


)- 6( 





آليات تحليل البيانات 


ومن الممكن أيضًا استخدام التمثيل الصوري كشكل من أشكال الاستنتاج التحليلي. 
وهناء لا يصف أو يعرض التمثيل الصوري مجرد البيانات فقطء ولكن يجري استخدامها 
أداة تحليلية. ويتم توجيه هذه الطريقة» والتي يطلق عليها مصطلح التحليلات الصورية, 
في الغالب بواسطة مجموعة من الأشخاص والخوارزميات التي تعمل باتساق لاستخراج 
البيانات» وبناء النماذج البصرية وتفسيرهاء والمضي قدما في المزيد من التحليل الإحصائي 
(2010 .21 غ» صننعك1). لقد أصبحت آليات التحليل البصرية مجالا ما وجديدًا من 
مجالات البحثء وهو الأمر الذي أسهم في تطوير حقل التمثيل الصوري للمعلومات من 
خلال دمج عناصر التنقيب عن البيانات, وعلوم الإحصاء والإدراك 00019 0ه وةتصمط]' 
6. فالعديد من أنواع الرسومات البصرية المختلفة شائع الاستخدام. وهي في العموم 
تفاعلية وتتيح للمستخدم التعامل معها والتلاعب في الصور من أجل البحث والكشف 
عن الأماط والروابط. وبالإضافة إلى ذلك فإن الشاشات ال معروضة للمستخدم متصلة 
ببعضها في الغالب بحيث إن التفاعل مع إحداها ينعكس على الأخريات» مما يمكن من 
تفخص جوانب من البيانات من أكثر من منظور واحد في ذات الوقت. فعلى سبيل المثال» 
يعرض الشكل (©1-6) أنواع آليات التحليل الصورية المتاحة ضمن أدوات آليات التحليل 
الصورية (6877). الموضوعة من قبل ال مركز الوطني للتحليلات الجغرافية الصورية في 
جامعة ينكوبينج (17021515167] عدامةع]1دذ]آ) في السويد. بالإضافة إلى توفيرها مجموعة 
مق الأدوات: ادلب فشكن أقوات للجفوعة مين تعليل البانات اسك نافيا يكل 
تعاوني» وبناء التطبيقات» والتداخل مع تطبيقات الخرائط كخرائط جوجلء وبناء وتبادل 
القصص السردية. وينشئ الأغحير تعدا الجعيافيا للأدواكه ها مكق الزملاء وغيرهم من 
تباال تفسيرات حسية متعلقة بالتمثيل الصوري (انظر الشكل 6 - 1). 


التحليل ١‏ لإحصائي (15وولهصة 1دء5)235)3): 

هناك تاريخ طويل من الأساليب الإحصائية التي يجري تطبيقها على البيانات الكمية في 
محاولة لفهمها. فالإحصاء الوصفي يفصل خصائص وتوزيع نقاط البيانات ومستوياتها من 
الخطأ وعدم اليقين. ويشتمل الإحصاء الوصفي على تحليل السلاسل الزمنية التي تنص على 
كيفية تغيّر البيانات بمرور الزمنء ونظرية الرسم البياني التي تدرس بشكل رياضي تنظيم 
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هياكل الشبكة. والإحصاء ا مكاني الذي يصف هندسة وأنماط التجميع, والتشتت. والانتشار» 
في حين يسعى الإحصاء الاستدلالي إلى شرح: وليس مجرد وصفء الأنماط والعلاقات التي 
قد توجد داخل مجموعة البيانات» واختبار قوة وأهمية الارتباطات بين المتغيرات. كما 
يشمل الإحصاء البارامتري (المعلمي) الذي يجري استخدامه لتقييم الفرضيات باستخدام 
بيانات الفاصل الزمني وبيانات مستوى النسبة» مثل الارتباط والانحدار؛ والإحصاءات غير 
المعلمية المستخدمة لاختبار الفرضيات باستخدام بيانات المستوى الاسمية أو الترتيبية؛ 
والإحصاءات الاحتمالية التي تحدّد احتمال حدوث حالة ماء مثل تحليل النظرية الافتراضية 
(صهزوع:27ه8). ويجري تطبيق تقنيات الإحصاء الوصفي والاستدلالي التي تستخدم تقليديًا 
في تحليل البيانات الصغيرة في البيانات الكبيرة أيضاء وكما جرى نقاشها في الفصل التاسع 
فإن هذا ليس سهلاً على الدوام لأن الكثير من هذه التقنيات جرى وضعها لرسم رؤى من 
البيانات الشحيحة وليست المتوافرة بشكل فائض. ومع ذلكء توفر هذه التقنيات وسائل 
للاستفادة من كميات البيانات الهائلة. كما يضمن حجم البيانات الهائل إمكانية تجزئتها إلى 
مجموعات بطرق عديدة دون أن تصبح صغيرة جدًا مما لا يمكن معه حساب الاختلافات 
بين مجموعتي الضبط وامعالجة بصورة ذات معنى. وتستخدم الإحصاءات بشكل روتيني 
في المساعدة على التنقيب عن البيانات والتنبؤ بها وتحسينها (انظر الجدول ١‏ -1). 


التوقع والمحاكاة والتحسين (121520102) م0 1210122120تا ساك رحامتاء نلء22): 

هناك طريقة أساسية في الحصول على القيمة من البيانات وهي استخدامها لمحاولة 
معرفة أو توقع ما سيحدث في ظل ظروف مختلفة. على سبيل المثالء قد ترغب شركة ما في 
توقع ردود أفعال العملاء تجاه منتج معين أو حملة ماء أو قد تحتاج الحكومة المحلية إلى 
محاولة التنبؤ بكيفية عمل البنى التحتية للنقل إذا جرى إغلاق عنصر مهم ذو حساسية, أو 
قد يسعى العلماء إلى التنبؤ بمموعد احتمال حدوث انهيار أرضي وتحت أية ظروف. إن مثل 
هذه المعلومات مفيدة جدا للمنظمات من حيث تمكينها من التخطيط لحالات الطوارئ 
ا مختلفة: وللشركات من حيث إنتاج أثر لزيادة نمو الأرباح (انظر الفصل السابع). وفي 
جميع الحالات» تبنى النماذج باستخدام المعرفة القائمة سلفًا عن كيفية عمل النظام, والتي 
تعالج البيانات لتقدير النتائج المحتملة في ظل سيناريوهات مختلفة. وكما في التنقيب عن 
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البيانات» هناك العديد من الطرق المختلفة التي يمكن استخدامها لإنتاج النماذج التنبئية. 
ولكل منها نقاط قوتها وضعفهاء وهي تنتج تنبؤات أقل خطأً أو أكثر دقة بالاعتماد على 
نوع المشكلة والبيانات (2010 151461 220 5621). ومع ذلكء. من الصعب الحكم 7 
على أن أي نوع من النماذجء: وإصداراته ال مختلفة. سيعمل بشكل أفضل على أي مجموعة 
بيانات معطاة. وقد تمثل الحل لهذه المسألة في استخدام نهج مركب يستفيد من الكمية 
الهائلة من الطاقة الحاسوبية المتاحة للمحللين الآن (2013 أموعزة). فعوضا عن اختيار 
نهج واحد وبناء عدد قليل من النماذج. فالنهج المركب يبني نماذج متعددة باستخدام 
مجموعة متنوعة من التقنيات للتنبؤ بالظاهرة نفسها. وبعد ذلكء بدلا من تحديد النتائج 
(التقديرات) من النموذج الأفضل أداء. يجري العمل على الجمع بين التقديرات من جميع 
النماذج لإنتاج إجابة واحدة شاملة. ويؤدي تجميع النتائج إلى نتائج أكثر قوة كما تعض 
العملية نقاط الضعف في كل نموذج. على سبيل المثالء قد يبني نهجاً مركباً لتوقع سلوك 
العملاء سلسلة من نماذج الانحدارء والشبكات العصبية» والجار الأقرب. وشجرة القرارات. 
فكل نموذج قد يكون أفضل من غيره في التنبؤ بأنواع معينة من المستهلكين: ولكن يمكن 
تقليل الفروقات من خلال الجمع بين مخرجات النموذج. مما يزيد التنبؤ قوة (كلصه:1 
3 اع5ء516 :2012). فباستخدام طريقة تضم العديد من النماذج ا منسجمة ممكن تطبيق 
ا مئات من الخوارزميات المختلفة على مجموعة بيانات: ومن ثم ضمان إنتاج أفضل نموذج 

فالمحاكاة هي عبارة عن نماذج تسعى إلى نمذجة العمليات والأنظمة في العام الحقيقي. 
والهدف من ذلك هو تحديد كيفية عمل نظام ما وكيفية سلوكه وفقا لسيناريوهات مختلفة, 
وتقييم أدائها إحصائيًا بهدف تحسين كفاءتها وفعاليتها (2003 هه50هذط10). ومن الأمثلة 
الشعبية لعبة الحاسب الآلي سيم سيتي (5152016(7) التي تحاي كيف يكن لمدينة أن تنمو 
وتتطور في ظل ظروف يختارها اللاعبونء قائمة على أساس النموذج الكامن وراء العمليات 
ا مدنية ا معروفة. وبالمثلء تستند توقعات الطقس على محاكاة لكيفية تطور الطقس بالنظر 
إلى الظروف السائدة والمعرفة العلمية. وهناك العديد من الأنواع المختلفة لنماذج المحاكاة, 
والتي استفاد كثير منها من التعلم الآلي من أجل تحسين عمل النموذج بشكل تلقائي 
والتعامل مع الخصائص الناشئة مثل الأحداث غير المتوقعة. إن نموذج سيم سيتي هو 
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نموذج قائم على التوكيل (2007 8266) (6-2560مء48). ويتكون هذا النموذج من بيئة 
تمكن من تعيين خصائص معينة للميزات الفردية فيها مثل المباني والطرق. ويتم تعبين 
خصائص هذه البيئة بواسطة وكلاء. وعند تشغيل النموذج: يسعى الوكلاء إلى حل مهمة ماء 
والتفاعل مع البيئة وغيرهم من الوكلاء الآخرين بالاعتماد على خصائصهم المسندة إليهم. 
وبا محصّلة. عند قيام الوكلاء بمهامهم. يقومون بتغيير البيئة. وهي في هذه الحالة امدينة 
التي يسكنونهاء وإنتاج نظام معقد ومتغير. ومن ثم فإن النظام يعمل من أسفل إلى أعلى. 
مع أنماط مكانية وزمانية تتغيّر من تفاعلات الوكلاء الفردية مع البيئة. وتستخدم مثل هذه 
النماذج لمحاكاة القضايا المدنية خارج الألعاب لنمذجة استخدام الأراضي وتخطيط النقل 
ووضع خطط الطوارئ للكوارث (2007 82167). 


ويهتم التحسين بتحديد الإجراء الأمثل لتحسين الأداء (عادة من خلال خفض التكلفة 
أو زيادة العائد أو المخرجات). ويمكن حساب التحسين باستخدام وتقييم نماذج التنبؤ 
وا محاكاة. أو تطويرها من خلال أنواع أخرى من الخوارزميات أو الاختبار الإحصائي. فعلى 
سبيل المثاله تستخدم الخوارزميات الجينية. وهو نوع معين من التعلم الآلي؛ الأفكار 
المنتقاة من الطبيعة. مثل الوراثة. والطفرات» والاختيار والتهجينء لوضع وتطوير حلول 
ممكنة لمشكلة ما (111996ءطء:311). كما يسعى علم الشبكات العصبية. وهو نهج آخر 
مستوحى بيولوجياء لمحاكاة كيفية عمل الدماغ البشريء باستخدام عناصر المعالجة العالية 
الترابط لحساب وتقييم وحل مشكلة ما (2000 <ه“21). كما يمكن استخدام اختبار أ/اب 
(8ضناوء1' 8/ى) بشكل دوري لتقييم وتطويع نظام ماء من خلال مقارنة مجموعة ضوابط 
مع مجموعات اختبار مختلفة من أجل تحديد العلاجات (على سبيل المثال. النصوصء» 
والتصاميم» والصورء والألوان االمستخدمة على موقع إلكتروني على الإنترنت) لتحسين هدف 
معين (على سبيل ال مثال. معدلات التبرع). 


الخلاصة: 
كان الهدف من هذا الفصل تقديم لحة عامة عن مجموعة من الآليات الناشئة وتحليلات 


البيانات التي يتم استخدامها لمعالجة وتحليل وتطبيق البيانات الصغيرة ال موسّعة والبيانات 
الكبيرة. لقد تم نبذ مثل هذه الأساليب لعدد من السنواتء ولكنها أصبحت أكثر انتشارً 
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ويمكن الوصول إليها مع تطورها ونضجهاء وتوفر المعالجة الحاسوبية المطلوبة لتصبح متاحة 
على نطاق أوسع. ومع ذلك. يطرح حجم وسرعة البيانات الكبيرة تحديات جدية لآليات 
التحليل وما قبلها بسبب عدم تصميم العديد من هذه الآليات التقليدية والخوارزميات 
لتتناسب مع المليارات من الملاحظات: أو لتتعامل مع مجموعات بيانات سريعة التغير 
(2012 .1 ]© انه ). ومن ثم فمن الواضح أن هناك حاجة إلى مزيد من البحوث 
لتكييف. وصقل وتوسيع الآليات الحالية وابتكار أساليب جديدة يمكن لها إضفاء معنى من 
البيانات الكبيرة والبنى التحتية للبيانات واستخلاص القيمة منها. وعلاوة على ذلك, أضحت 
الأجيال الجديدة والقديمة من العلماء ومحللي الأعمال. على حد سواء. بحاجة إلى التعرف 
على مصادر البيانات الجديدة وخصائصهاء وأن تتعلم مجموعة جديدة من المهارات إذا 
كانت تريد أن تكون قادرة على الدراسة والاستفادة من رؤى وأفكار طوفان البيانات القائم» 
متضمنا ذلك معالجة البيانات المنظمة والبينات غير المنظمة» والترميز الأساسيء والتنقيب في 
البيانات» والتمثيل الصوريء والنمذجة. والمحاكاة (انظر الفصل التاسع). 

إن هذه التحديات لا تقوم على مجرد أسس تقنية أو موارد بشرية. فإِنْ آليات التحليل 
تعد انعكاسًا لطريقة معينة في الرؤية والاستشعار للعام المحيط؛ فهي مظهر من مظاهر 
المعرفة الخاصة. وكما نوقش في الفصل الثامنء تثير البيانات الصغيرة الموسعة والبيانات 
الكبيرة وآليات التحليل ال مرتبطة بها تساؤلات جوهرية بشأن تنظيم وممارسات العلوم 
(5101012012). مع العديد من المقترحات التي توحي بالدخول في نموذج علمي جديد. 
ونتيجة لذلك. لا يتطلب التصدي لطوفان البيانات مجرد فكر جديد حول طرق التحليلء» 
ولكن تفكيراً متأنيًا فيما يتعلق بفلسفة العلوم (2012 026111»,آ). ويستدعي جزء كبير من 
هذه المهمة التفكير النقدي في التأطير الواسع للتحليلات وآليات الطرق والمناهج المحددة, 
والتفكير في كيفية إنتاج آليات التحليل الجديدة أنواعًا معينة من المعارف والرؤى للعالم 
المحيط بناء ومن ثم العمل على معرفة عمل هذه المعارف الجديدة في العام متضمناً 
ذلك نمذجة كل الأشياء التي تشير إليها (2013 ام صند1 :2013 075 تناظ مسد رع 8؛ 
انظر الفصل الحادي عشر). وبعبارة أخرى. هنالك حاجة ملحة وبصورة عاجلة للبحوث 
الفنية والفلسفية فيما يتعلق بآليات التحليل الناشئة من أجل استشعار البيانات الموسّعة 
والبيانات الكبيرة. 
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المبررات الحكومية والتجارية للبيانات الكبيرة 


(0262آ1 عأ 101 12160221 ووعسماسباظ مقنة لمخصع سمه عط1) 


م تتكشف ثورة البيانات دون فكر وبطريقة مجهولة, فكما هو حال الثورات الأخرى. 
جرى الدفع بها بسبب مجموعة قوية من الحجج. والتمهيد لها من قبل مجموعة من 
المتحمسين المؤمنين بفوائد الطرق الجديدة للمعرفة والتعامل في هذا العام وتحالف 
أصحاب المصالح الخاصة الذين يجنون الأرباح من ظهورها. وفي حين أن الحجج التي 
البعقدمة يكن أن ككون مسوعة ذا فالتا ماسقا عن وحياث فظز معدافة. إلا أنيا 
تشكل في مجموعها ما أطلق عليه (1977) ا1تتهعتاه10 مصطلح نظام الخطابة وامجادلة. 
أي مجموعة من النقاشات المتداخلة التي تبر وتغذي التطورات الجديدة وتعمل على 
تطبيعها واستنساخها وإعادة استخدامها. فهذا النظام الخطابي يقدّم الأساس المنطقي 
لتبني الأفكار والتقنيات الجديدة» وإضفاء الشرعية على مساعي تطويرها وسبل تنفيذها. 
وتدعو النقاشات المستخدمة في النظام إلى الترويج لرسالتهم وجعلها قناعة عامة؛ لترغيب 
الناس والمؤسسات باعتناق منطقهم. وإلى الاعتقاد والعمل فيما يتعلق بهذا ال منطق 
(2005 صخطءغ 1 لصه ءع2048). كما عملت على إنتاج أجواء معيّنة يتم من خلالها 
"تغذية أنواع خاصة من الفكر والممارسة بحيث تبدو طبيعية ومرغوبًا فيها" (220 سنس 
1111165): وهي تخرس توعًا خاضًا من الاستحجابة العاطفية (2009 2هؤاءع0طظ). 
فمثل هذه الخطابات والأجواء سعت إلى إعادة صياغة العام وفق رؤية خاصة: وإعادة 
تشكيل "القضايه الفاعلينء المخاطر, المصالحء والرغبات التي تنتشر في الحقل السياسي 
وامشهد الاقتصادي" (4 :2013 غاعمموظ). 

وكما تم النقاش في الفصلين الثاني والثالث. فقد سعت نظم الجدال والمحاورة المتداخلة 
إلى الدفع بعمليات تطوير البنى التحتية للبيانات والبيانات المفتوحة مستخدمة النقاشات 
وامداولات حول تبادل ومشاركة البيانات. واستنساخها وإعادة استخدامهاء وحرية النفاذ 
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والوصول إليهاء والحكومة المفتوحة» والشفافية: وا لمساءلة: وتنظيم المشاريع الاجتماعية, 
واقتصاديات السعة ووفورات حجم الإنتاج. وكما تم بيانه في هذه الحالات فإن منحى 
النقاش وطريقة التداول قد تكون مدفوعة من قبل مجموعة من الأطراف المعنية التي قد 
تستخدم الحجج نفسها ولكن لتحقيق مرام مختلفة (على سبيل المثالء تستخدم منظمات 
ا مجتمع المدني وقطاعات الأعمال الكبيرة خطابات الشفافية والمساءلة لإتاحة بيانات الحكومة 
وفتحهاء ولكن أحدهما لأسباب مدنية والأخرى للانتفاع ا مالي من البيانات). فالأنظمة 
الخطابية إذاً لم تكن حهرًا نتاجًا فوقيًا من الدول أو الأعمالء ولكنها انتشرت وسنت من 
خلال العديد من القنوات الأصغر حجما (1978 ,1977 1801121114). وقد جرى قبولها دون 
إشكالية من قبل الجماهير. من ال مواطنين والمؤسسات الذين كان من السهل استمالتهم 
من خلال منطقهم. وبالأحرى» فإن الخطابات مفتوحة للتحديء والرد عليهاء ومقاومتها. 
وتفنيده ا.ء ومخالفتهاء والتصدّي لهاء وإظهار عوارهاء وتقديم رؤى بديلة جديدة. وفي كلتا 
الحالتين» يستند الممروّجون أو المعارضون لرؤى جديدة على السجل الزمني الممتد من الماضيء 
إلى الحاضرء وحتى المستقبل لدعم حججهم., وذلك باستخدام الأدلة والشواهد من جولات 
سابقة من التغير الاجتماعي والاقتصاديء إلى جانب التحديات الحاضرة: والتكهنات حول 
الكيفية التي يمكن أن تشكل الكيفية التي ستكون عليها الأمور خلال سنوات قادمة: في 
ظل سيناريوهات مختلفة. (2012 ,2011 7إ51مة]1). ومن ثم حرى تداول المشهد الخطابي 
عبر جولات من التفاوض باسم الصراع على الأفكار والسبل لهيكلة وتمثيل وعمل وتنظيم 
ا مجتمعات. في الحاضر والمستقبل. 


وفي هذا الفصلء سيجري دراسة المبررات المنطقية للبيانات الكبيرة للجهات الحكومية 
وقطاع الأعمال. وقد تم تنظيم النقاش حول أنماط خاصة من النظم والأنشطة الاجتماعية 
بدلاً من تنظيم الفصل بحسب مختلف الخطابات التي يشيع توظيفها للترويج لإشاعة 
اعتماد البيانات الكبيرة على سبيل امثالء التبضّر والحكمة. الإنتاجية: القدرة التنافسية, 
الكفاءة. الفعالية. الفائدة. الاستدامة. والتوريق اهالي (دم نخد غتدنهء5). فالخطب 
تمتلك تأثيرها الأقوى عندما يجري تعبئتها وتوجيهها في مهام وقضايا معينة: والمثير في 
حالة البيانات الكبيرة هو أن جدالها يمتد إلى جميع القطاعات والشرائح - الاجتماعية, 
والسياسية» والاقتصادية» والبيئية؛ فهي واعدة من خلال تقديمها وسائل جديدة كليا في فهم 
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وإدارة جميع جوانب حياة الإنسان. وهناء سيتمٌ مناقشة هذا الوعد فيما يتعلق بأربع 
مهام رئيسية هي: حكم الناس وتنظيمهم. وإدارة المنظمات. وتعزيز القيمة وإنتاج رأس 
المال» وأخيراً إنشاء أماكن أفضل. وهذه مهام توضيحية فقطء على سبيل الحصر وليست 
شاملة. حيث إن هناك العديد من التطبيقات الأخرى الممكنة: بما في ذلك القضايا البيئية 
(انظر 115016 220 520122 :2013 اعوعذ5 :2013 تع تلبات لحته تتعوتء طاطم حك 5 -1ع:1/137 
2. وستتم مناقشة كيفية إعادة تشكيل البيانات الكبيرة للبحوث في الفصل التالي» كما 
سيجري مناقشة الدعوات المضادة لتطبيق البيانات الكبيرة في الفصل العاشر. 


حكم الشعب وتنظيمه (ع1جزم»ء2 ع سندءء:0607): 

الدولة هي مولدٌ ومستخدم رئيس للبيانات» فمنذ عصر التنوير سعت الدولة لإنشاء 
طرق أكثر منهجيةء من جهة: لإدارة وحكم المجاميع السكانية» ومن ناحية أخرىء لتقديم 
الخدمات للمواطنين. فإحدى هذه الطرق الرئيسية التي هدفت من خلالها إلى أداء هذه 
الأدوار بكفاءة وفعالية كانت من خلال التدقيق والتقدير الكمي والنوعي للمجتمع - أي 
بناء معرفة مفضّلة لإنفاذ ولايتها القضائية والاختصاصية من خلال تطوير النظم الإدارية 
على نطاق واسع. بدعم من أجهزة فنية وتقنية متنوعة. تعمل على قياس وتتبّع فهرسة 
وتمييز البيانات عن الأفراد. والشركات, والمؤسسات. وال مكونات الأخرى (انظر 220 410250 
005 320 ستطاءغق] :1998 وع2051612وه10 :2001 طمصسصدآط له وعمعمدظ :1987 تماد 
5 2076 :2011). إن إنتاج. وإدارة. وتخزينء وتحليل البيانات من اطهام الرئيسية 
في جميع مؤسسات الدولة» فهي تستخدم في تقييم الالتزامات والاستحقاقات للموضوعات 
السيادية وغير السيادية. والكشف والمراقبة عن الخروقات وعدم الامتثالء والتهرب 
والغش. فيما يتعلق با معايير والالتزامات القانونية المعمول بها (1996 ©105). فعلى 
سبيل المثالء يتم في الدوائر الحكومية. وخاصة تلك المتعلقة بالتمويل والتجارة والرعاية 
الاجتماعيةء تحديد جميع المواطنين والكيانات وتتبّعهم. ورصد القضايا والاتجاهات من 
خلال التحديثات على سجلاتهم, وتعبين ملفاتهم التعريفية وربط بياناتها بهم؛ وتعقب 
المدفوعات,. وإدارة انضباطهم والخدمات المقدمة لهم. أما في المدارسء فيؤخذ التسجيل 
لبياناتهم» واحتساب وتقييد الدورات الدراسية وعلامات الاختبارات» ويتمٌ مكافأة الطلاب 
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ومعاقبتهم وفقًا لأدائهم وسلوكهم. وفي قطاع الصحة» يتم قياس حالة المريضء وتسجيلهاء 
والعمل على أساسهاء واحتساب وتقييم أداء المرافق الصحية. كما تعنى وكالات حكومية 
متخصصة أخرى بإنتاج وإدارة وتحليل ونشر البيانات التي لها بالغ الأثر في إفادة العمل 
الحكومي. على سبيل المثال, الوكالات الإحصائية, وهيئات المسح ورسم الخرائط الجغرافية, 
وأجهزة الاستخبارات التي تتعهد ببرامج مستمرة لإنتاج البيانات من خلال أنظمة قياس 
مثل المسح والمراقبة. 


ولتعزيز ممارساتها الحسابيةء سعت الدولء من جهة: لتبرير وترشيد نظمها وعملياتها 
على الموضوعات» ومن جهة أخرىء لتطبيق وسائل إدارية أكثر تعقيدًا وتفصيلا من أي 
وقت مضى (2001 2011168 :1994 :إهااء31). فا مسعى الأول يشمل الخطابات حول 
الحكومة الفعالة والقيمة مقابل امالء والمواطنة والتمكين. والعدالة ومكافحة الجرمة, 


الجماعي والمبادئ المشتركة. وتجابه هذه الخطابات من قبل أولئك الذين لديهم الرغبة في 
تقليل مستوى رقابة الدولة وسلصطتها مقابل الحريات الشخصية. والرقابة والضبط للنظم 
ا مجتمعية والاقتصادية» أو أن تكون أكثر انفتاحًا واستجابة وإنتاجية في ا ممارسات الحكومية, 
ْئً0آظ2, ذلك إتاحة البيانات التي يحملونها بشكل أكبر وأكثر حرية (انظر الفصل الثالث). 
أما الممسعى الثاني فيتضمن تنفيذ أنظمة وتقنيات وبنى تحتية مصممة لجمع ومعالجة 
البيانات على نحو فعال وأكثر تطورًا من أي وقت مضىء متضمناً ذلك الأنظمة الأكثر ثبانًا وقدرة 
في التعريف والتحديد (التواقيع والصور وبصمات الأصابع: وأرقام الضمان الاجتماعي وجواز 
السفرء وقوانين الضرائب, وأرقام الترخيص والحسابات. والمعلومات البيومترية» وا مستخدمين 
وكلمات السر والرموز البريدية... إلخ)» والتي يمكن تشغيلها على نحو متزامن بشكل متزايد 
وعن يُعد (2005 صنطء161 4صه +ع600). وعليه؛ يؤكد (178 :1997) أقصصة81 على أن أحد 
أشكل الحاكمية الأكثر فعالية يكون في الغالب من خلال تكوين "لفيف معقد من مجموعة 
بسط النفوذ والهيمنة...من خلال التعدادات والبيروقراطية والسياسات,. وما إلى ذلك» وكم 
هائل من المؤسسات التخصصية مثل الممدارس وأماكن العملء والأراضي ا ممتدة المجهولة المثبتة 
بملايين من نقاط الانطلاق كأجهزة الصراف الآلي وكاميرات المراقبة» ونماذج تعبئة الطلب". 
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ولذاء فإن البيانات الكبيرة بأحد معانيها ليست شينًا جديدًا على الدول - وهي التي 
تعاملت طويلاً مع كميات هائلة من البيانات في إدارة الاختصاصات القضائية والقانونية, 
كجزء جرى معالجته واتخاذ الإجراءات المتعلقة به في الوقت المناسب في حينه أو قريبًا منه 
كلما تفاعلت الوكالات مع الموضوعات. ومع ذلكء ينظر إلى البيانات الكبيرة باعتبارها أحدث 
مجموعة من التقنيات التي يمكنها توسيع وتحسين عمل الدول من خلال زيادة الانضباطية 
والشمولية للممارسات الحسابية لأعمالها. كما يتبنى البائعونء في بعض الحالات. خطاب 
الدفع بحلول البيانات الكبيرة بهدف بيع خدمات الدولة: وفي حالات أخرىء تأخذ الدولة 
بزمام المبادرة بشكل نشط. وفي الوقت الحاضرء هناك نوعان من الإستراتيجيات الخطابية 
الرئيسية ا مستخدمة لتشجيع استخدام البيانات الكبيرة في السلطات الاختصاصية» يتعلق 
النوع الأول بالتحسينات على الإدارة العامة وتقليل التكاليف من خلال تعزيز الكفاءة 
التشغيلية وتقليل تكلفة الأخطاء والاحتيال في إدارة المنافع» وزيادة في الإيرادات الضريبية 
عن طريق تضييق الفجوة الضريبية... وتحسين تخصيص التمويل في البرامج والخدمات ذات 
الجودة الأعلى. وزيادة المساءلة في القطاع العام: وإطلاع أفضل للمواطنين". مع تقديرات 
مقترحة بعائدات لحلول البيانات الكبيرة من الكفاءة التشغيلية المتعلقة بإدارة القطاع العام 
في القارة الأوروبية تعادل مئة وخمسين مليار دولار أمريي (,61 :2011 .1ه © و لأترصه1ة 
2). وسيجري لاحقًا مناقشة هذه الحجج بشكل أكبر فيما يتعلق بإدارة المنظمات وصنع 
أماكن أفضل. 

ويهتم النوع الثاني بأمن الدولة ومكافحة الجريمة, إذ تقوم جميع الدول بالمراقبة 
والرصد لأغراض الأمن والسلامة ومنع الجريمة والاعتقال من خلال أجهزة الشرطة وجمع 
المعلومات الاستخباراتية على نطاق أوسع. وقد تمّ تطوير الكيفية التي تنفذ بها هذه 
الأنشطة با يتماثى مع التقنيات الجديدة - كالتنصت على المكاللمات الهاتفية واعتراض 
الموجات الراديوية» والدوائر التلفزيونية المغلقة» والتصوير الجويء وصور الأقمار الصناعية, 
ومراقبة الإنترنت - والتي كثيراً ما جرى التبرير لها عند وقوع أحداث رئيسية مثل الحرب 
الباردة. والحوادث الإرهابية (2001 65هد1]). وفي الآونة الأخيرة, قدّمت أحداث الحادي 
عشر من سبتمبر وما تبعها من الحرب على الإرهاب المبزر المنطقي لتغيير جذري في عمليات 
المراقبة والتأمين التي تقودها الدولة على نطاق واسع (2006 1:20076ق). وكان جليًا لبعض 
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الوقت أن تحليلات البيانات الكبيرة كانت عنصرًا أساسيا في تحسين هذه الأنشطة. وخاصة 
فيما يتعلق بممراقبة الحدود وفحص الهحرة (245ع272ع01) :2006 ع12008 له ستطاء )ك1 
73. وقد كشفت تسريبات يونيو 2013 بشأن برنامج وكالة الأمن القومي الأمريي 
بريزم (011534) المدى الذي وصلت إليه ممارسات مراقبة البيانات. وممارسات البيانات 
الكبيرة. والآليات التحليلية المستخدمة لجمع ومعالجة البيانات المتعلقة بالاتصالات اليومية 
لجميع المواطنين مثل المكاطات اليومية» الرسائل النصية» رسائل البريد الإلكتروني» واستخدام 
الإنترنت,. بدلا من اقتصارها على المواطنين الأحانب والقوى الخارجية أو لأهداف محددة 
(2013 تته[اطاغخطء نآ له صعئن8 :2013 الكعاوخعدة]5 لحنه 210نتدءء61). فهذه التسريبات 
كانت هي الأحدث في سلسلة الكشف عن تجسس الولايات المتحدة على مواطنيها بشكل 
خفي (2009 8221054 : 2007 501056). والواقع: أن من الواضح أن الوكالات الاستخبارتية, 
والمتعاقدين العسكريين-الصناعيين» هم في طليعة مطوري الجيل القادم من أدوات البيانات 
الكبيرة لإدراك الكميات الهائلة من البيانات عالية السرعة. وقد استثمرت بكثافة في بناء 
الكفاءات والتقنيات والمرافق على سبيل المثال. جرى استثمار 1.7 مليار دولار أمريكي في 
مركز البيانات القائم في يوتا لمعالجة وتخزين البيانات الكبيرة التي تم جمعها من الولايات 
(0810112013). وبينما تسعى الدول إلى ترشيد تلك اطراقبة ذات النطاق الواسع على 
مواطنيها من خلال الخطابات العامة الموجهة للأمن والسلامة. فإن الحقيقة الماثلة هي 
أنها قد طوّعت الكثير من أجهزتها سراً لتنفيذها ودون اتباع للإجراءات القانونية الواجب 
العمل بها مما يقوّض اطثل العليا للدمقراطية القائمة على الشفافية والثقة (وتمعصء1© 
73. ومع ذلكء. فمن غير المرجح على المدى القصير أن يقوم الغضب الشعبي العارم على 
هذه ال ممارسات والتجاهل الصارخ للحقوق الأساسية مثل الخصوصية: على إبطاء أو إعادة 
تشكيل طريقة التعامل مع البيانات الكبيرة في هذا الجانب من الحكم. ولا لثني الخطابات 
التي استخدمت لتبريرها. 
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إدارة المنظمات (152)1025مدع 01 ع تعد مد]31): 

ماما كما تغيرت الدول وتفرعاتها الكثيرة في الحكم كالإدارات. السلطات المحلية» 
الوكالات. الجيشء مقدمي الرعاية الصحية... إلخ مع مرور الوقتء واعتمادها ممارسات 
وتقنيات إدارية جديدة لإعادة تشكيل الكيفية التي يجري بها تنظيمها وتشغيلهاء بالمثل» 
قامت شركات الأعمال والكيانات المؤسسية الأخرىء مثل ال منظمات غير الحكومية والهيئات 
التطوعية والمجتمعية: والجمعيات الخيرية: والأحزاب السياسية... إلخ. فالبيانات المتعلقة 
بمهامها الأساسية تشكل أحد الجوانب الأساسية لكيفية فهم هذه المنظمات لنفسها ودوائرها 
الانتخابية: وكيفية اتخاذ القرارات بشأن عملياتها الحالية والمستقبلية. كما أن البيانات 
تقدم الإثبات والدليل للإنتاج ا لمعرفي الذي يستخدم لإدارة المنظمة بشكل أكثر كفاءة, 
وفعالية» وتنافسية» وإنتاجيةء وتحديد المنتجات والأسواق الجديدة (انظر القسم التالي). 


وهكذاء أصبحت نظم ال معلومات على مدى السنوات الستين الماضية من البنى التحتية 
الأماسية لجميع المنظمات على اختلاف أحجامهاء مما يمكنها من تتبّع وإدارة المجاميع البشرية 
المعقدة كالموظفينء الداعمينء المانحين, والعملاء» والمكونات, والسلع الأساسية: والبنى التحية 
عبر الزمان والممكانء وتمكينها من توسيع نطاق عملياتها من ا ممستوى المحلى إلى ا مستوى العالمي 
(2003 صع>ءزط :1996 115ء]025). فنظم المعلومات تتيح تشغيل المنظمات بشكل أكثر ذكاء. 
وإنتاج وفورات كبيرة من تكاليف قاعدتها التشغيلية. وهناك ثلاثة من هذه النظم المعلوماتية 
المبنية على البيانات والتي تم اعتمادها على نطاق واسع: نظم تخطيط موارد المنظمات (18188): 
ونظم إدارة سلسلة التوريد (5021).: ونظم إدارة علاقات العملاء (/13©). وتسهّل هذه 
الأنظمة قدرًا أكبر من التنسيق والضبط داخل المؤسسة. ومع المنظمات الأخرىء والعملاء. على 
سبيل المثالء ينظم ويجمع نظام تخطيط موارد المنظمات العديد من قواعد البيانات والأنظمة 
المتعلقة بالشراءء التخزينء الجرد, النقلء التسويقء ال محاسبة: إدارة شؤون ال موظفين وإعداد 
قوائم المرشحينء إدارة المشاريع: والعلاقات مع العملاء في نظام واحد شامل يضمن بصورة 
سهلة وتلقائية توافر البيانات والعمليات من حزء واحد من الأعمال لجزء آخر (.21 )أ 1227 
6 .ل ]© 36 :2006). كما تستخدم نظم إدارة سلسلة التوريد (5021) بأكبر قدر 
من الكفاءة لتنظيم ا مشتريات, والحركة, وإدارة وتخزين المواد من الموردين من الشركة وحتى 
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الزبائن (2012 811201 220 12م010). في حين تسعى نظم إدارة علاقات العملاء (01131) 
إلى بناء علاقات شخصية مع العملاء من خلال جمعها أنماط الحجوزات والمشتريات السابقة 
لهمء وعرض التفضيلات والخدمات ال ممكن الاستفادة منها خلال زياراتهمء والاستفادة منها في 
تقديم مكافآت الولاءء والعروض الخاصة. والترقيات,ء وتقديم التوجيهات للموظفين والأنظمة 
ليظهروا بممظهر العارف بالعميل (2005 515212). وقد أكد (2011) .81 أء ده55[ه م8:27 من 
خلال دراسة شملت 179 شركة من شركات التداول العام الكبيرة على اعتماد هذه الشركات في 
اتخاذ القرارات المبينة على البيانات ((1آ101(0 -106151052 10115762 102:8) حيث يكون الناتج 
والإنتاجية أعلى بما يراوح بين 7-0 عما هو متوقع عند الاعتماد على استثماراتهم الأخرى 
وطرق استخدام تقنية ال معلومات. 


ويُنظر إلى البيانات الكبيرة من قبل العديد على أنها المرحلة التالية في العملية الجارية 
التي تسعى إلى الكفاءة التنظيمية والبنى التي تعرز الميزة التنافسية: مع الحد من المخاطرء 
والتكاليف. والخسائر التشغيلية. وتحسين تجربة العملاء. فالذي توفره البيانات الكبيرة هو 
الإمكانية الشاملة ول مفصّلة لغاية إدراك جميع جوانب عمل المؤسسة بشكل آني ولحظي. 
وكما افترضت جماعة الضغط. مؤسسة تك أمريكا (:2012 «20260ناه1 دعت سخاع]” 
2 فإن البيانات الكبيرة ستضع الأساس: لاستبدال أو دعم عمليات اتخاذ القرار البشرية 
بخوارزميات آلية» مما يعمل على الحد من أوجه القصور داخل المنظمات؛ ويوجد الشفافية؛ 
ويحسن الأداء من خلال تمكين التجريب لاكتشاف الحاجات وإظهار التباينات؛ وتحسين العائد 
عن الاستثمار (801) لاستثمارات تقنية المعلومات. وتحسين عملية اتخاذ القرار والتشغيل 
الذي؛ وتوفير قدرات تنبؤية لتحسين مخرجات المهام؛ والحد من التهديدات الأمنية والجريمة؛ 
والقضاء على الهدر والاحتيال» وإساءة الاستخدام والمعاملة؛ وابتكار نماذج أعمال وخدمات 
مستفيدين جديدة. 

وبعبارة أخرىء ستوفر البيانات الكبيرة معرفة لحظية غاية في الدقة المفصّلة لكبار 
ا مديرين في جميع مناحي منظماتهم والتي يمكنهم من خلالها صياغة دورات عمل محكمة. 
وسشيكن البيانات الكبيرة اللنظلمات هين أن تكون أكار قطي .ووااقئةومرتة ومنكة 
وذكية في كيفية تنظيمها وتشغيلها (2011 .21 اه معلتتحته/8). 
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ومثال على كيفية التوظيف الناجح للبيانات الكبيرة من قبل منظمة غير تجارية 
لإعادة هيكلة وإدارة عملياتها الحملة الانتخابية لباراك أوباما عن الحزب الديمقراطي. 
فكما أشرنا في الفصل الرابع» فقد تبنت الحملة الانتخابية لأوباما البيانات الكبيرة. من 
خلال جمع مجموعة هائلة من البيانات من مصادر متعددة وإنتاج بيانات اقتراع معتبرة 
لحظبا فى الوقت الكتانيبمن أجل إدازة رد الفعل» وتشكيل الإستراديجية. والتجراءات: 
ومهام العاملين والمتطوعين. واستنادًا إلى تحليل الأداء عام ,٠٠١8‏ فقد نمت مجموعة 
تحليلات البيانات للحملة الانتخابية لأوباما للعام 7٠١١7‏ في الحجم خمسة أضعاف عنها في 
حملة ٠٠١‏ متضمنة روادًا تقنيين جرى التعاقد معهم من سوق الصناعة (2012 تعناع حل 5). 
وقد حسّنت هذه المجموعة العلائقية بين البيانات التي تمّ جمعها من مصادر مختلفة 
بحيث أمكن ربطها معاً بشكل أكثر فعالية. كما طوّروا تطبيقات للحملة الانتخابية وجرى 
استخدام شبكات التواصل الاجتماعي مثل فيسبوك للدفع باتجاه التسجيل للانتخاب 
والحصول على التصويت لصالحهاء وتشيت ملفات تعريف الارتباط (0001246©5) الخاصة 
بهم وتلك المتعلقة بأطراف تم التعاقد معها على أجهزة الزائرين بلوقعهم الإلكتروني 
لجمع البيانات عنهم وتتبع عاداتهم على الشبكة (2012 عترزهكآ :2012 162 هم ). 
كما قاموا بتحسين تصنيفاتهم التعريفية وتوقعات النماذج التنبئية وكيفية استخدام 
المعلومات الناتجة عن تحليلاتهم لتوجيه الحملة. بالإضافة إلى اختبار وصقل طرق زيادة 
التمويل لدعم الحملة ماليًا (2012 #©:عداء5). كما أضافوا وعالجوا البيانات الجديدة 
بشكل مستمر مع تشغيل لأنظمة المحاكاة للتنبؤ بالنتائج وأفضل الردود. وكما صرّح 
أحد مسؤولي الحملة: "لقد شغلنا نموذج المحاكاة 77,0٠٠‏ ألف مرة في كل ليلة" لتحديد 
احتمالات الفوز في كل ولاية متأرجحة". وفي كل صباح يصل إلينا الناتج» هذه هي فرص 
نجاحكم في الفوز في هذه الولايات» وبهذه الطريقة تم تخصيص الوارد (مقتبس عن 
2 16 5). لقد حصل فريق أوباما على مزايا مهمة عن منافسيهم من خلال 
التشغيل اللمستمر لمجموعات قواعد البيانات المتغيرة من خلال خوارزميات متطورة, 
وعليه أشار (246 :2012) ع1ءطادهء155 إلى أن حملات أوباما الانتخابية كانت "ال مجموعة 
السياسية اللقالية» المؤسيبية الكميلة حرّداء القاقة غان البيانات: والمماريسة المجريبية 
الصارمة ". وهذا هو وعد الدعاة للبيانات الكبيرة بأن الفوائد العائدة عنها كالتي اكتسبها 


ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة, والبنى التحتية للبيانات, والنتائج المترتبة عنها 9 


الفصل السابع 


الحزب الديمموقراطي من البيانات الكبيرة» لها أن تتحقق لجميع ال منظمات وغيرها من 
شركات قطاع الأعمال. 


تحصيل القيمة وإنتاج رأس المال (1481م02 عوصمع مله لصة عسله؟ عسنعدعءع.1): 


فضلاً عن جعل الشركات أكثر كفاءة وفعالية في إدارتهاء يتمّ الترويج بكثافة للبيانات 
الكبيرة لتكون وسيلة لرفع مستوى القيمة الناتجة من أنشطة الشركة وعلاقاتها مع الموردين 
وا مستهلكين. وفي الواقع. وكما أشار (2011) [عمصاعظ لصة عخصدت. فإن المحرك الرئيسي 
للبيانات الكبيرة ليس تقنيًا؛ ولكنه فال مع الوعد بالمزيد من الكفاءة والأرباح. ومن ثم 
فإن اعتماد حلول البيانات الكبيرة هو إستراتيجية لإدراك تراكم رأس امال غير الممستغل 
بطريقة تقدم عائدا كبيرا من الاستثمار وتوفير ميزة تنافسية (:2011 .21 © مكلتتقطته/1 
2 .21 4 21105011105). وهناك العديد من الطرق التي يمكن من خلالها لحلول 
البيانات الكبيرة أن تضفي الذكاء للشركات وبطريقة يمكن معها أن تنمو مبيعاتها وأرباحها. 
فمع الأخذ لقطاع البيع بالتجزئة كمثال. حدّد (2011) .21 ]© انرصه31 ستة عشر حلاً 
مقسّمة إلى خمسة أنواع - التسويقء والترويج» والعمليات. وسلسة التوريد. ونماذج الأعمال 
الجديدة - يمكن لكل منها تحصيل مكاسب محتملة في مجال ا مبيعات والكفاءة (انظر 
الجدول .)/-١‏ وهي تشمل إنتاج بيانات عبر الشركة وتطبيق آليات التحليل من أجل 
تقسيم السوقء والتصدي لعزوف العملاء والموظفين. وتحسين المدخلات المختلفة (على 
سبيل المثالء المكونات. والعمالة. والمرافق) وتؤدي من ثم إلى بناء مختلف التشكيلات 
والنماذج التنبئية للإجابة عن مجموعة متنوعة من الأسئلة من قبيل: 


٠‏ هل يتم الاتصال بالعميل أم لا (التسويق المستهدف)؟ 

٠‏ هل يتم تقديم عروض للاحتفاظ بالعميل أم لا (المحافظة على العملاء)؟ 

٠‏ أي نوع من الإعلان أو اختيار الكلمات / الصور أو المنتج تقدم للعميل (انتقاء المحتوى)؟ 
« أي قناة ينبغي الاتصال من خلالها بالعميل (اختيار القناة)؟ 

٠‏ هل يتم تقديم عرض أعلى أو أقل سعرًا للعميل (التسعير/الخصم المتغير)؟ 

هل يتم شطب جزء أكبر من الدين عن المقترض (التحصيل)؟ 
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٠«هل‏ يتم تقديم حد اثتماني أعلى أو أدنى أو معدل فائدة للعميل (مخاطر الائثتمان)؟ 
(2013 لاعوعذة). 

وللتركيز على نوع واحد من أنواع الحلول الخمسة التي قدمها (2011) .21 © معلأتتصه]ل, 
وهو التسويقء يمكن استخدام عدد من آليات التحليل وأدوات إدارة البيانات الكبيرة 
الموزعة في أربعة محاور هي: التوحيد والاختزال» التقسيم والتجزئة: المطابقة. والتحسين. 
وذلك لإدارة ومعالجة وتحليل وتفسير البيانات من أجل تلبية الأهداف (انظر شكل ١‏ -17). 
إن هدف التسويق السلوي هو بيع البضائع والخدمات بصورة أكثر فعالية للأفراد والعملاء 
وبناء علاقة طويلة المدى معهم من أجل الحفاظ على عاداتهم وذلك من خلال الانسجام مع 
خصائصهمء وسلوكهمء وميولهم» ورغباتهم (2011 501076 0ه #اتنه5270). فمن خلال 
بناء الملفات التعريفية الفردية للأشخاص ودمجها مع التحليلات التنبئية» تسعى الشركات 
إلى تقديم تجربة شخصية من خلال التسويق الجزثي للمنتجات والعروض الخاصة. وني 
سبيل ذلك. تسعى الشركات إلى توقع نية العميل في الشراء وتسهيل تحقيقهم لهذه النية 
بلطف. مع السعي لبناء ولاء العملاء في الوقت نفسه (2013 .281 © 111ع3815). وفي ذات 
المعنى» زعم 566051110 8111 أن "الموزعين يستخدمون البيانات الكبيرة في محاولة للحصول 
على المستهلكين" ( مقتبس في 24 :2010 8011161). 

وقد تم بالفعل تنفيذ مثل هذا النهج للبيانات الكبيرة من قبل عدد من تجار التجزئة 
مثل وول مارت وتيسكو. حيث تنتج مثل هذه السلاسل من المتاجر كميات هائلة من 
البيانات يوميًا من خلال نظم تخطيط موارد المنظمات (8119). وإدارة سلسلة التوريد 
(50).: وإدارة علاقات العملاء (0834) الخاصة بهاء بما في ذلك ربط منافذ المبيعات 
بالزبائن من خلال بطاقات الولاء والاتتمان ( في حالة وول مارت هناك ما يقارب /751 
مليون معاملة يومياً)» واستخدامها لوضع إستراتيجيات أفضل للأسعار. ومخططات التخزين» 
وإعداد قوائم الموظفينء ومراقبة المخزون» والحملات الإعلانية؛ وتكاليف الموردء وتحديد 
مواقع جديدة للتخزين والمنتجات....إلخ» واقتطاع حصة من سوق منافسيها عند القيام 
بذلك (2010 :801116). وعوضا عن إجراء مسوح عينية ضيقة ودراسات استقصائية باهظة 
التكلفة, لاستطلاع آراء المشاركين عن ماذا سيفعلون وما هي القيمة المعتبرة بنظرهم, تقوم 
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الفصل السابع 


البيانات الناتجة عن العمليات والتصفح على الشبكة بالكشف عن هذه المعلومات عبر 
جميع ا مستهلكين. فالفوائد المتوقعة مرتفعة. حيث يشير (2011) .21 أ© وعلتوصه31 إلى 
أن البيانات الكبيرة يمكن أن تزيد هوامش التشغيل لتجار التجزئة بنسبة ١0‏ في المائة» وفي 
حين أن هذه الحلول المتعلقة بمبيعات التجزئة والتتسويق من ال ممكن أن تتوفر في مختلف 
القطاعات. فإن درجة بروزها يختلف من قطاع لآخر بين مختلف القطاعات الأكثر استفادة 
من حلول معينة (انظر الجدول ؟١-7).‏ 

الجدول رقم ١(‏ - 7) 


أنماط ذكاء البيانات الكبيرة للشركات 


التسويق البيع العابر للحدود (باستخدام المواقع الجغرافية للزبائن: وتاريخ الشراءء 
(وصنع ه31 ) والتفضيلات, والمعطيات الأخرى لزيادة متوسط حجم الشراء) 


التسويق القائم على الموقع (باستخدام الموقع الحالي بشكل آني أو لحظي. 
على سبيل المثال نظام تحديد المواقع الجغرافية في الهواتف الذكية, 
واستهداف الزبائن الموجودين في امتاجر أو بالقرب منها) 
تحليل السلوك داخل المتاجر (تتبّع الهواتف الذكية» وسلال التسوّقء وامراقبة 
امرئية للمساعدة في تحسين مخطط توزيع امتجر» وتنوع المنتجات. ومواضع 
الأرفف لزيادة المبيعات) 
التقسيم الجزئي للعملاء (استخدام تاريخ الشراء والتصفح لاستهداف العملاء 
بشكل فردي بالإعلانات والعروض الخاصة) 
التحليل العاطفي (تتبّع ورصد آراء العملاء على مواقع التواصل الاجتماعي 
لتحديد ميلهم تجاه منتج ما وتعديل الحملات التسويقية بشكل مناسب) 
تعزيز تجربة العملاء مع تعدد القنوات (إنشاء تجارب وفهارس على شبكة 
الإنترنت مصممة بشكل فردي بحسب العملاء) 
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التبضع تحسين التشكيلة (تخصيص البضائع لحفظها في أي من المتاجر استنادًا إلى المواقع 
(وصادنةصهطءم381) ٠‏ الجغرافية المحلية» وانطباع المشترين وسلوكهم, والحقائق المحلية الأخرى) 
تحسين التسعير (باستخدام السلوكيات الشرائية والجغرافية لاتخاذ قرارات 
التسعير في مختلف امواقع لزيادة ا مبيعات / الأرباح) 
تحسين التموضع والتصميم (باستخدام السلوك داخل المتجر والتفاعلات على 
الموقع الإلكتروني لتوجيه عملية تصميم الموقع / المتجر وأماكن وضع البضائع 
لزيادة المبيعات) 


العمليات شفافية الأداء (التحليل المفصّلء بشكل آني أو لحظي على نحو متزايدء لتحديد 
(كدم وعم 0) مدى أداء امنتجاتء والمتاجرء والموظفين) 
تحسين مدخلات الموظفين (احتساب ال مستويات المثلى للتوظيف وجدولة 
المناوبات لتفادي فرط التوظيف أوشح القوى العاملة) 
(منهطن تإاممنت5) | ودورات المبيعات الفصلية: والأحداث والظروف المحلية لضمان مستويات 
مناسبة من المخزون المطلوب) 


تحسين التوزيع والدعم اللوجستي (تحديد مواقع البضائع بشكل آني أو 
لحظيء واحتساب مسارات الطرق الأكثر ملاءمة وكفاءة من حيث الوقت 
والوقود. ومراقبة سلوك السائقين. وجدولة أعمال الصيانة) 


مفاوضات ال موردين (باستخدام البيانات المتعلقة بتفضيلات المستهلكين 
ومشترياتهم لإبلاغ مزودي المنتجات) 


نماذج الأعمال خدمات مقارنة الأسعار (تقديم خدمات مقارنات شفافة من أطراف ثالثة 
الجديدة (مبع21 للزبائن لأسعار المنتجات بشكل آني أو لحظي عبر مختلف تجار التجزثة) 


(15ع1/100 811511155 الأمواق القافيةغان الودب كسان الفسوقة القادى قد مون مات ب 


مضافة مثل الوصول إلى الباعة الآخرين» ومعلومات المنتجات. والمراجعات 
الناتجة عن المستهلكينء ومقارنات الأسعار) 





المصدر : جمعت من 21.2011:67-71 اء يعلتتصه3/1. 
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مقتبس من "البيانات الكبيرة: آفاق جديدة للابتكار والمنافسة والإنتاجية". (معهد 
ماكينزي العاطي 116أناكم1 610521 تإءمصتكك]8 (2011 ترد/3) 


(3337ه جز ححة0 )ع8 بإ 5 لكك 11/1 ع جح /حطم» ,تزع ص لكل مم تا . 


وإضافة إلى الدفع بالفوائد المتوقعة. سعى دعاة البيانات الكبيرة أيضًا إلى دعم اعتمادها 
من خلال تسليط الضوء على عواقب فشل الاستثمار فيها. على سبيل المثالء أشار هكلتتوطة]/1 
(2011:6) .21 »© إلى أنهم: "يتوقعون أن يرونء عبر القطاعات, تحقق القيمة التي تعود 
على المستخدمين الرئيسيين للبيانات الكبيرة على حساب المتقاعسين عنها", وبعبارة أخرى. 
سوف يتخلف أولئك الذين لا يستطيعون التأقلم واعتماد حلول البيانات الكبيرة عن الركب 
ويتعرضون للتعثر والأفول؛ لأنهم سيفقدون حصتهم في السوق. وبغض النظر عما إذا كان 
استخدام الخطابات للدفع أو الجذبء فقد أضحت البيانات الكبيرة للأعمال منتشرة داخل 
التيار الرئيسي ووسائل الإعلام التجارية منذ العام 2012م, وبالنظر لفوائدها ال موصوفة: يبدو 
أن البدء في تطبيقها على نطاق واسع سيمثل المرحلة التالية للابتكار التقني وذلك بصورة 
مؤكدة. 
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الشكل رقم ١(‏ - /) 


التسويق والبيانات الكبيرة 
أهداف المسوقين قدرة ا منصة 


العمليات 


الأحداث 
إدارة علاقات العملاء 
مكامات الدعم 


622 نظرة أحادية للعميل 


التوحيد والاختزال 


التكتل /التجميع 
حيازة البيانات 


ٍْ اختيار الخصاة 
© زيادة دقة الاستهداف 1 ا 2 
١ 5‏ 


الرسائل الشخصية 
خوارزمات المطابقة 


© كدن االصالة نه حسابات المصفوفة 
59 تجزثة القيمة الأحادية 


التنبق 
خوارزميات التنبؤ 


بآ الانحدار الخطي 





امصدر: مقتبس من 2012 عوتء 8 -عترء0135ن. 
تم إعادة الطباعة بإذن من المؤسسة الدولية لآلات الأعمال: © المؤسسة الدولية لآلات الأعمال 


(0110م01ن وعصتطعد]/8 ووعصتكسا8 لمدم ل غمصمعغص1]). 
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الجدول رقم ١(‏ - 0) 
فوائد البيانات الكبيرة لعشر صناعات مختارة 


ا مراقبة المتقدمة للحالة تحديد التصرف القادم الأمثل 
تجميع وتسعير السيارات الجديدة نمذجة الكوارث 
مطالبات الضمان الغش في المطالبات 
تحديد التصرف القادم الأمثل ا مراقبة المتقدمة للحالة 
تحليل سجل النظام مراقبة وتحسين الحفر 


الطاقة والخدمات 


تحليلات العداد الذي التحسين الآلي للأسعار 


التنبق بتوزيع الأحمال وجدولتها التشكيل المحلي 


منع الجرائم والتهديدات والتنبؤ بها ضمان الخدمة الأفضل 
تحليلات الاحتيال والنفايات وإساءة المعاملة ذكاء الشبكة 
استحداث منتجات وخدمات جديدة 
التدبير والتصرف بناء على الصحة العامة 
للمجتمع 
إشراك المستهلكين في رعايتهم الصحية 





المصدر: أي بي إم (4.ه) 182/1.) ) 


مركن 0ط لمخم كع 1ح / مهل /عنته 50157 /ححامء. محاحاة. 1077-01 / /نصاخط 
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المبررات الحكومية والتجارية للبيانات الكبيرة 


إيجاد أماكن أفضل: 

اخترع الناس واعتمدوا على مر التاريخ على تقنيات جديدة صممت لإنشاء الثروة 
وتحسين الحياة اليومية وتعزيزها. وقد أثرت العديد من هذه التقنيات بشكل كبير 
على طبيعة وهيكل وتنظيم وسنّ الحياة المدنية والريفية, في الخدمات الخاصة المُقدمة, 
والنقلء والاتصالات. وبناء البنية التحتية. فهذه التقنيات تحمل في كثير من الأحيان 
تأثيرات متناقضة وسلبية على سبيل المثالء المصانع التي صنعت الثروات» وفي الوقت 
نفسه التلوث البيئي أيضًَاء أو أن تكون مبالغا فيها بحيث تتجاوز الطاقة الاستيعابية 
على سبيل المثال» الاكتظاظ أو الازدحام ال مروريء أو تنتج التبعيات التي لا تمكن أن 
تطاق على سبيل المثال» المسافات الطويلة بين مواقع السكن ومواقع العمل. إن تقنيات 
المعلومات والاتصالات (تكنولوجيا المعلومات والاتصالات) هي أحدث موجة من الأجهزة 
والبنى التحتية الجديدة التي أضحت جزءًا لا يتجزأ في نسيج البيئة التي نعيش بهاء 
ومعها مكوّن مهم من مكونات منطقها الاستطرادي وهو أنها تعمل على توفير الحلول 
للمشاكل الناجمة عن الدورات السابقة من التنمية التي قادتها التقنية - بحيث تجعل 
منها أكثر كفاءة واستدامة. ونظافة, وهنا وإنتاجية.. ٠‏ إلخ - وكذلك إنشاء طرق جديدة 
ماما للعمل في العالم اللحيظ ‏ ؤتشعة لذلافة قثت المدن ققمة اللعلومات والاقضالاكه 
على مدى العقود القليلة الماضية» باعتبارها عنصرًا أساسيًا في إستراتيجياتها الإنمائية 
(1998 ممنتطعخت] :1996 812232 ته مسقطودء© :1996 والاعاأاقوت). 

إن مفهوم المدن الذكية هو تجسيد لهذه الرؤية التي تقودها تقنيات المعلومات 
والاتصالات للتنمية المدنية. والذي يصف الأماكن التي تتكون بشكل متزايد وتراقب بواسطة 
الحوسبة المنتشرة والحوسبة في كل مكانء ويقود ضبط اقتصادها وإدارتها الإبداع» والابتكار, 
وزنادة الأعمال: من قبل أناس أذكياء. وهذه الدن الذكية محيية تشكل مكتف ومكن 
فهمها وضبطها بشكل آني أو لحظي؛ فون تنتج .وتتبادل» وتدمج وتستههلاك: وتعمل على 
البيانات الكبيرة (2014 صنطءغة]1). إن مثل هذه البيانات الكبيرة توقر 5 شاملا كيرا 
متشلا بدقة لهذه امدن وا لمدخلات للأنظمة التي من شأنها بناء أماكن أكثر ملاءمة للعيش, 
وآمنة. ووظيفية. وتنافسية. ومستدامة (2013 101705620' :2013 .21 أء ع>كاءمة21). فمثل 
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الفصل السابع 


هذه الرؤية للمدن الذكية يجري الترويج لها بشكل كبير من قبل عدد من أكبر مزودي 
خدمات البرمجيات في العام وشركات الأجهزة الرقمية (على سبيل المثال. سيسكو. وآي بي 
أم. ومايكروسوفت, وإنتل» وسيمنزء وأوراكل» وساب) والتي اعتمدت بحماس من قبل 
المؤسسات البلدية والوطنية والعابرة للحدود التي تتوقع لتقنيات المدن الذكية أن تنتج 
تقدم اجتماعي -اقتصادي وتجدد المراكز المدنية لتصبح مراكز للابتكار والعمل ()ء :نم1 
2 81). وفي حين تم بناء بعض مشاريع المدن الذكية من الألف إلى الياء (على سبيل 
ا مثالك سونغدو (800مه5)» أو مدينة مصدر (0167 8125021)): فإن معظم هذه المشاريع 
تدريجية: وتتألف من إعادة تجهيز للبنية التحتية القائمة مع تقنيات رقمية وحلول للبيانات؟ 
لأن الوظيفة الرئيسية للبيانات الكبيرة في كلتا الحالتين هي توفير تحليلات بشكل آني أو 
لحظي لإدارة كيفية جوانب وظيفة المدينة وتنظيمها. 

لقد استخدمت هذه المراقبة وآليات تحليل البيانات الآنية واللحظية لعدد من السنوات 
في بعض القطاعات. على سبيا المثال» قيام العديد من اللمدن ببناء أنظمة النقل الذكية, 
والتي تستخدم البيانات الناتجة عن شبكة من الكاميرات والنواقل والمتعلقة بحركة ال مرور 
حول نظام ما لتقديم تغذية راجعة للركز تحكم مركزيء. وتستخدم مراقبة وتنظيم التدفق» 
وتعديل تسلسل حركة المرورء وحدود السرعة المسموح بهاء وإدارة العقوبات المتعلقة 
با مخالفات المرورية بشكل تلقائي (20072 «نداء]1 220 ء12008). وبالمثل. فقد ترصد 
وتراقب الشرطة مجموعة من الكاميرات وسحجلات الحوادث الحية من أجل توجيه الموارد 
ا مناسبة لمواقع معينة للاستجابة السريعة وبكفاءة. كما يمكن جمع البيانات المتعلقة 
بالظروف البيئية من خلال شبكة استشعار موزعة في جميع أنحاء المدينة» على سبيل 
المثالء قياس وتتبّع تلوّث الهواءء ومستويات اللياه» أو النشاط الزلزالي. وتستخدم العديد 
من الحكومات المحلية نظم إدارية لتسجيل مشاركات الجمهور وتفاعله مع خدماتها. وفي 
جميع الحالات تقريباء كانت هذه الأنظمة معزولة عن بعضها البعض وتتعامل مح قضية 
واحدة ويتم التحكم بها من قبل وكالة واحدة. 

وفي الآونة الأخيرة. كانت هناك محاولة لجمع كل هذه الأنواع من المراقبة والتحليل في 
مركز واحدء وأن تستكمل بآليات تحليل عامة ومفتوحة على نطاق أوسع. على سبيل المثاله 
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قام مركز العمليات في ريودي جانيروء البرازيل» والذي تم إنشاءه بالشراكة بين حكومة 
المدينة وشركة آي بي أم, بتجهيز نظام على مستوى كافة أنحاء امدينة حيث يجمع البيانات 
من ثلاثين وكالة معاً في مركز موحّد لتحليلات البيانات, بما في ذلك حركة المرور والنقل العام, 
والبلدية وخدمات المرافق. وخدمات الطوارئ. ونقاط جمع بيانات الطقس. وا معلومات 
اللسئلة من قبل اللوظقين والحميون عبن الواتقم والإنونفكه والزاةي (انظر الكل 7.2 
©2012 512861). هناء تعمل الخوارزميات وفريق من المحللين على معالجة. وتصور 
وتحليل» ورصد كمية هائلة من بيانات الخدمة الحية» جنبا إلى جنب مع البيانات ال مجمعة 
مع مرور الزمن وكميات ضخمة من البيانات الإدارية التي تم إصدارها على أسس دورية 
بصورة أكبرء وغالباً ما يتم المزج بين مجموعات البيانات معا للتحقيق في جوانب معينة من 
حيةة المدينة والتغييرات الحاصلة فيها مع مرور الوقتء وبناء النماذج التنبئية فيما يتعلق 
بالتنمية والإدارة اليومية للمدينة وإدارة حالات الكوارث كالفيضانات. ويكمل هذا عن 
طريق منصة العمليات الافتراضية التي تمكن المسؤولين في المدينة من تسجيل الدخول من 
الميدان والوصول إلى المعلومات بشكل آني أو لحظي. فعلى سبيل المثالء يمكن للشرطة 
في مشهد الحادث المروري استخدام المنصة لمعرفة عدد سيارات الإسعاف المرسلة للموقع 
وموعد وصولهاء وتحميل معلومات إضافية على الموقع (2012 51286:7). وكان الهدف 
امعلن من عمدة امدينة: إدوارد بايس (2265 1:0112100): هو إسقاط الحواجز بين الإدارات 
وضم بيانات كل منها إلى الآخر لمساعدة المنظومة بأكملها (2012 معع8ه51). كما يجري 
تطوير مراكز مماثلة في أماكن أخرىء يصاحبها مجموعة من التطبيقات للمواطنين للوصول 
والاستفادة من بعض مناحي البيانات. 

أما بالنسبة لأولئك العاملين على تطوير واستخدام آليات تحليل متكاملة وآنية 
لبيانات المدينة. فإن مثل هذه المراكز والتطبيقات توفر وسائل فعالة لاستشعار وفهم 
العيش في المدينة وإدارتها في الوقت الراهنء وتصوّر وتوقع السيناريوهات المستقبلية, 
وإجراء توزيع الموارد بالاعتماد على الدليل وتسهيل التفكير المترابط عبر الحكومة 
(2014 صنطء ك1 :2013 5:ه110:0). وبدلاً من اتخاذ القرارات استنادًا إلى الكلام 
المتداول: أو الحدس والظن. أو المحسوبية. أو أدلة دورية / جزئية. فمن الممكن تقييم 
ما يحدث فى أي وقتء والرد والتخطيط المناسب له. 
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وعلاوة على ذلكء يوفر استخدام عينات كبيرة وربط أشكال متنوعة من البيانات 
تحليلا أكثر عمقاء وشمولية. وقوة. وقد أصبح من الممكن للدعاة مثل هذه الأنظمة 
تطويرء وتشغيلء وتنظيم» وخوض غمار الحياة في المدينة على أساس قويء ودليل 
منطقي غير ضعيف. لا دليل انتقائي مبني على أسس إيديولوجية سياسية (151077655 
273). وهكذاء فثمة من يقولء إن استخدام هذه البيانات الكبيرة سيوفر الأساس 
طدينة أكثر فعالية. واستدامة. وتنافسية» وإنتاجية, وانفتاحاء وشفافية. إلا أن آخرين 
يحذرون من أن البيانات الكبيرة تشير إلى احتمالات الوصاية "8704061 عذ8 ". وأشكال 
الحكم القائم على التقنية (ع01211ططءع1'). وخصخصة (012615311012م001) إدارة 
المدينة (انظر الفصل العاشر). 


الخلاصة: 

رسم هذا الفصل الدوافع الدعائية للبيانات الكبيرة فيما يتعلق بأربع مهام رئيسية 
هي: حكم الشعب. وإدارة المنظمات, وتعزيز القيمة وإنتاج رأس امال وإيجاد أماكن 
أفضل للحياة (حيث سيجري مناقشة إمكاناتها بالنسبة للعلوم في الفصل التالي). وقد 
بيّنت المناقشة الكيفية التي يتم بها تأطير البيانات الكبيرة سياسيًا واقتصاديًا (انظر الفصل 
الأول) وكيف يتم وضع مجموعة قوية من البيّنات والحجج العقلانية لدعم البدء في 
تنفيذ واعتماد تقنيات البيانات الكبيرة وحلولها. وتتضح قوة الأنظمة الخطابية التي 
يجري بناؤها من خلال النظر في الحجج المضادة - حيث من الصعب أن نقول إننا نريد 
أن نبقى في حالة أقل تبصّرًا وحكمة. وإنتاجية. وتنافسية: وكفاءة, وفعالية. واستدامة, 
وأمنّا... إلخ. فإذا كانت البيانات الكبيرة تقدم كل هذه الفوائد. فإن دعاة البيانات 
الكبيرة يجدون من غير المنطقي عدم المضي قدمًا في تطوير نظم البيانات الكبيرة ودعمها. 
وبطبيعة الحال: فإن الحجج التي قدّمت هي ضيقة وانتقائية وتبتعد عمدا عن تسليط 
الضوء على الآثار السلبية المحتملة فيما يتعلق بالحريات المدنية» ومراقبة البيانات» والفرز 
الاجتماعيء وأمن البيانات. وانفلات زمام التحكم وفرض السيطرة: والحكم الاستباقي. 
والحكم التكنوقراطي (القائم على التقنية) والخصخصة. وغلق التقنيات وعدم إتاحتها 
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بصورة أكير (انظر الفصل العاشر). فهذه هي وجهة نظر أصحاب المصالح الخاصة: ولا 
سيما أولئك الذين يسعون لبيع تقنيات البيانات الكبيرة. والحكومات التي تسعى نحو 
رؤية الليبرالية الجديدة للحكم والتنظيم (الليبرالية الجديدة: هي فكر أيديولوجي يبمثل 
تأييد الرأسمالية ال مطلقة وعدم تدخل الدولة في الاقتصاد.). وليست وجية نظر المواطنين 
أو المجتمعات التي من الممكن أنها لا تزال من دعاة البيانات الكبيرة والحوسبة في كل 
مكانء ولكنهم يتصورون أن استخدامها سيكون بطرق تحررية» وتمكينيه. وتشاركية مع 
إخضاع التأثيرات الأكثر سلبية للرقابة والتنظيم. 


لقد تميّز التحليل المعروض في هذا الفصل بالإيجازء مع توفير لمحة شاملة لبعض الحجج 
التي تطرح. وما هو مطلوب في الوقت الحاضرء من خلال دراسات الحالة المحددة هو 


يتعلق بالترويج للبيانات الكبيرة في المدن الكبيرة. فهناك حاجة لرسم وتجزثة الكيفية 
التي تروج بها مختلف الخطابات الداعمة فيما يتعلق بأماكن محددة من خلال المجلات 
التجارية والمواقع الإلكترونية.ء والصحف اليومية: واي مواد الترويجية للشركات. وسجلات 
الدولة: والبيانات السياسية... إلخ. وتقاطعات الأجندات المختلفة ومصالح ال معنيّين. وهذا 
يحتاج إضافة إلى تحليل الكيفية التي يتم بها التصدي م«لثل هذه الخطابات برؤى بديلة, 
وتحليل المُعارضات والتداخل بين الحجج الخطابية وتتبّع تسلسل الكيفية التي تحولت 
بها مع مرور الوقتء والتحليل المقارن للمشهد الخطابي عبر مختلف البقاع, أن يصاحبه 
تحليلٌ لآثار الخطابات على تشكيل الكيفية التي يعمل بها المجال في الممارسة والنتائج 
المترتبة على تنفيذ حل البيانات الكبيرة. 

وبالنسبة فيما يتعلق بالنقطة الأخيرة» بين (2014) 202ه521 بالتفصيل أنه بمجرد أن يتم 
تطبيق حل قائم على البيانات فإنه من النادر أن يحقق الفوائد التي توقعها المتحمسون 
والداعمون لذلك الحلء وغالبًا ما ينتج عن الحل مجموعة من القضايا الجديدة. وقال 
إنه توجه لقانون كامبل (1:257 115 مدصون). الذي صاغه عام الاجتماع دونالد كاميل 
6) 1م0322 :1 120221).: ليشرح هذه الظاهرة. فقانون كامبل ينص على: "إنه 
كلما كثر استخدام أي مؤش اجتماعي كمي الضنع القرار الاجتماعي» كلما كان الموضوع 
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تحت ضغوط الفساد وأكثر عرضة للتشويه وإفساد العمليات الاجتماعية التي يهدف 
إلى رصدها." أو بحسب صياغة سلمون نفسه: "كلما جرى تشغيل حقل بنظام ما بشكل 
أكبرء أوجد هذا النظام المزيد من الدوافع للجميع (الموظفينء والعملاء, والمنافسين) لتخيير 
سلوكهم بطرق منحرفة ضارة - مما يوفر أكثر من الشيء الذي تم تصميم النظام لقياسه 
وإنتاجه. سواء كان لذلك أي قيمة في الواقع أم لا". 

وبعبارة أخرىء يبدأ الناس في اللعب على النظام بعقلانية واعتبار المصلحة الذاتية, 
ولكن في كثير من الأحيان بطرق غير متوقعة لإفساد المقايبسء والخوارزميات» وعمليات 
صنع القرار الآلي. على سبيل المثالء أشار (44 :1995) 750116 إلى أنه "عندما يتم 
الحكم على مديري الأعمال من خلال حساباتهم فإنهم يبدؤون التعلم على كيفية 
تحسين حساباتهم, ربما من خلال بعض الحيل من قبيل تأجيل الصيانة اللازمة وغيرها 
من التكاليف ذات المدى الطويل". ونتيجة لذلكء فإنه في حين يمكن أن تتحول كيفية 
إدارة وتشغيل ال منظمات والحكومة؛ لتصبح قائمة على البيانات ومقاييس الأداءء. فإنه من 
العمل آن تحدك ذلك اقازا مددوعة دغر عو قهل و تفعل [ سكالا مهينة نين الحاكمية: 
ليس بالضرورة أن تكون إيجابية في مجملها. 

ولذاء تحتاج دراسات البيانات الكبيرة وآثارها إلى الانفتاح لعرض السياسات والأجندات 
الكامنة للبيانات الكبيرة في مختلف السياقات وتوفير أساس لزيد من المحادثات المعيارية 
حول هذا النوع من عواطم البيانات الكبيرة التي قد نرغب في العيش بها. فهذه الأنواع 
من المحادثات هي قيد التطوير في الوقت الحاضرء ويرجع ذلك بشكل جزي إلى حداثة 
التطورات وسرعة وقوعهاء وأيضًا بسبب هيمنة الأطروحات المبالغ بها عن البيانات الكبيرة 
ومكائد أصحاب المصلحة المعنيين بها. ومع ذلك تضل الحاجة قانمة لمثل هذه الأحاديث 
بالنظر إلى أن البيانات الكبيرة تعيد تشكيل الطريقة التي يجري بها حكم المواطنينء 
وتنظيم ا مواقع» وإدارة المنظمات. وعمل الاقتصاديات. وممارسة العلوم. 
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الفصل الثامن 
إعادة صياغة بحوث العلوم» والعلوم الاجتماعية» والعلوم الإنسانية 


(240ة ععسضعك5 ل[دك50 رععمعك5 01 5اأسدممءع 18 عط 1' 


ءتدعدع1 1115م سطس ط) 


ف حديث مجلة الإيكونيميست 2 العام 0 م ذكر سنان آرال (لهعكى سهصند), 
أستاذ إدارة الأعمال في جامعة نيويوركء أن "الثورات في العلوم غالبا ما يسبقها ثورات في 
القياس" (مقتبس عن 2010 1012161©). إن هذا الفصل يستكشف مدى انطباق ملاحظة 
آرال فيما يتعلق بالبيانات الكبيرة: والبنية التحتية للبيانات, والبيانات المفتوحة. وتأثيراتها 
فيما يتعلق بكيفية مقاربة البحوث والاكتشافات الأكاديمية من منظور فلس في ومنهجي. 
وعلى وجه الخصوص,. يقوم هذا الفصل بدراسة كيفية تحدى توافر البيانات الكبيرة والبنى 
التحتية للبيانات إلى جانب الأدوات التحليلية الجديدة للنظريات والعلوم المعرفية القائمة 
في مختلف التخصصات- الكيفية التي يتم بها طرح الأسئلة وكيفية الإجابة عنها- ويؤدي إلى 
نشوء مجالات وتخصصات جديدة. وهكذاء يستكشف هذا الفصل ما إذا كانت التغيرات 
التي تطرأ على الطريقة التي يتم بها إنتاج وإدارة وتحليل المادة الخام للمعلومات وا معرفة 
ستؤدي إلى تغيير جذري في فهم وممارسة المبادئ الأساسية التي تقوم عليها العلوم؛ والعلوم 
الاجتماعية والإنسانية. وبعبارة أخرى. هل تقود ثورة البيانات إلى نقلة نوعية في المجالات 
الرئيسية للعلوم والبحوث؟ 

بمثل النموذج (دمع2:201). كما حدّده كوهن (1962) ططتككء وسيلة مقبولة لاستجواب 
العام وجمع المعرفة المشتركة بين نسبة كبيرة من الباحثين في اختصاص معين في لحظة زمنية 
معينة. ويتشارك الباحثون العاملون ضمن نطاق هذا النموذج في فلسفة واحدة» واستخدام 
مجموعة من الأساليب الشائعة. وطرح الأسئلة والإجابة عنها للعمل على بناء المعرفة بصورة 
تدريجية. ومن ثمء فإنهم بميلون إلى تفضيل التصنيفات, والمعارف والنظرياتء والأساليب» 
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والأطر الأخلاقية والعقائدية نفسها أو القريبة من بعضها البعض. ومع ذلك فقد أشار 
كوهنء وبصورة متكررة, إلى بروز طرق جديدة للتفكير تتحدى النظريات وامناهج المقبولة 
والمعمول بها. على سبيل المثال» فإن النظرية النسبية لآينشتاين جابهت, وإلى حد كبير. حلت 
محل نظرية نيوتن في الفيزياء. وبالمثلء أحدثت نظرية التطور لداروين تغبيراً جذرياً في 
الفكر النظري للعلوم البيولوجية» كما تحدّت المذاهب الدينية في معتقدات النشوء والخلق. 
وفي كلتا الحالتين» فقد تمسك بعض الناس بالطرق المتبعة في التفكير وتشبنوا بهاء في حين 
انتقل آخرون إلى الفكر الجديد., والذي سرعان ما أصبح الفكر ا مهيمن. وفي بعض المجالات 
الأكادممية, هناك القليل من الأدلة على نماذج عاملة: لا سيما في العديد من العلوم الاجتماعية, 
مثل علم الاجتماع والجغرافيا البشرية: حيث تم تطبيق مجموعة متنوعة من المناهج 
الفلسفية على سبيل اطثال. الوضعية (1)351552و20), والظواهرية (7إ20108ع2طهمصعطط). 
والبنيوية (11211552ااء5)0): وما بعد البنيوية (20565]11]111211552)... وغيرهاء وقامت 
العديد من هذه المعسكرات النظرية بطرح آراء متعارضة بشأن أفضل السبل لفهم العام. 
وفي مجالات أخرىء مثل العلوم, كان الاجتماع أكثر على وحدة المنهج العلمي المتبع» معززاً 
باختبار الفرضيات للتحقق منها أو نفيها. وهذا لا يعني. مع ذلك. عدم تحؤل أو تغيّر 
الطريقة التي تعمل على تصوير ونشر المنهج العلمي بشكل دوريء ووجود بعض النظريات 
المتنافسة فيما يتعلق بشرح ظواهر معينة, فالنظريات يمكن أن تختلف حول الظواهر 
ولكنها تشترك في نفس النهج الأوسع للمساعي العلمية. 

وقد بين جيم غراي (31337 12[)ء على سبيل امثال (كما هو مفصل في .له اه 11 
9» تطور العلوم من خلال أربعة نماذج. حيث أشار إلى أن النموذج الرابع ما زال في 
بداياته ولكن هو نتيجة لثورة ا معلومات المنتشرة (انظر الجدول 8.1). وبخلاف طرح 
كوهنء تحدث التحولات في النموذج لأن النموذج السائد في العلم لا يمكنه تفسير بعض 
الظواهر ال معينة أو الإجابة عن الأسئلة الأساسية: ومن ثم تبرز المطالبة بإعادة صياغة 
أفكار جديدة, فتحولات غراي تأسست على التطورات الجارية في أشكال البيانات وتطورات 
الأماليب التحليلية الجديدة. وسيستكشف هذا الفصل إلى أي مدى يأق وجود النموذج 
الرابع في العلوم, وإلى أي مدى تقود ثورة البيانات إلى نظريات معرفية بديلة في العلوم 
الإنسانية والعلوم الاجتماعية. وبالنظر إلى المراحل الأولية نسبيا في ثورة البيانات المنتشرة, 


هف ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة, والبنى التحتية للبيانات, والنتائج المترتبة عنها 


إعادة صياغة بحوث العلوم, والعلوم الاجتماعية» والعلوم الإنسانية 


فربما لن تتفاجاً بتباين الآراء حول تأثير البيانات الكبيرة» والبيانات المفتوحة؛ والبنى التحتية 
للبيانات, وتحليلات البيانات الجديدة على إنتاج نظريات معرفية جديدة» وسيستمر وجود 
مثل هذه التباين في الآراء. ولكنء لا مجال للشك في أن البيانات الكبيرة» والبيانات المفتوحة» 
والبنى التحتية للبيانات» وتحليلات البيانات الجديدة تطرح قضايا معرفية أساسية وذلك 
لأن استخلاص المعلومات الصحيحة وال مفيدة من طوفان البيانات لا يعد ببساطة قضية فنية 
يمكن التعامل معها من خلال حلول تقنية فحسب (2012 110:101). 


الجدول رقم ١(‏ -6) 


نماذج العلم الأربعة 


3 اجريية ود الور اطي 


سي | صععة | سساضست ا عدضوسيا 


الرابع العلوم الاستكشافية يتسم بكثافة البيانات» الاستكشاف 8 الوقت الحالي 
الإحصائي والتنقيب عن البيانات 


المصدر: تم التجميع من 2009 .21 ا» 7إ©11. 





النموذج الرابع للعلم (ععمعءعك5 صا حصىنلدعد2 طعمبده8 عط1): 

في حين أن جيم غراي 1877© 80ذ[) تصور أن النموذج الرابع في العلوم يتسم بكثافة 
البيانات واتساع المنهج العلمي المؤسس. إلا أن بعض العلماء الآخرين يرون أن البيانات 
الكبيرة أفسحت الطريق لبزوغ عصر جديد للفلسفة التجريبية (ناوك11أمدط). حيث 
يمكن لحجم البيانات الذي تصحبه أساليب معينة أن يكشف عن الحقيقة الكامنة فيها؛ وأن 
يمكن البيانات من أن تتحدث عن نفسها وهي متحررة من النظرية. وقد اكتسبت وجهة 
النظر الأخيرة الاعتمادية خارج المجمعات العلمية» وخاصة داخل دوائر الأعمال؛ ولكن 
أفكارها تأصلت وتجذرت في المجال الجديد لعلوم البيانات والعلوم الأخرى. فكلا المنهجين 


ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة, والبنى التحتية للبيانات, والنتائج المترتبة عنها فق 


الفصل الثامن 


يوفران تحدياً للمنهجية العلمية التقليدية إضافة إلى طرح نموذج بديل محتملء وفي هذا 
الجزء. سيتم دراسة الادعاءات العلمية لكلا المنهجين بشكل نقدي. 


عودة ظهور الفلسفة التجريبية (حاوك1تأمرصاظ 01 عممعويء مسظط-ع 18 عط]1'): 
بالنسبة للبعضء. فإن فلسفة النموذج الرابع هي ما أطلق عليه (2 2013) 82001 
«منهج البيانات» (15:0ذ-122:8): وهو محاولة التقاط أي شيء على شكل بيانات واستخلاص 
مستوى معين من التبصر منها: "فأي شيء يمكن قياسه يجب أن يتم قياسه... البيانات هي 
منظور شفاف وموثوق يس مح لنا بتنقية العاطفية والأيدلوجية؛ إن البيانات ستساعدنا 
على فعل أشياء رائعة - مثل التنبؤ بالمستقبل". إن من شأن مثل هذه الادعاءات المتعلقة 
بالبيانات أن تعزز كثيراً من الدعايات بشأن البيانات الكبيرة داخل مجتمع الأعمالء ويتم 
التعبير عنها بشكل عام من خلال الصياغة التجريبية - التي يمكن لها من خلال الحجم 
الكافي للبيانات أن تعبر البيانات عن نفسها. ومثل هذه الفلسفة التجريبية متضمنة بشكل 
أمثل في ادعاءات (2008) 4120612502 135تطان. وهو رئيس تحرير سابق في مجلة وايرد 
(187164). والذي ضربت دعوته التأليبية بأن البيانات الكبيرة ما هي إلا مؤشر على "انتهاء 
النظرية" على وتر حساس للكثير من المعلقين. لقد ذكر 42061750 في مقطوعة استفزازية 
أن "طوفان البيانات يجعل المنهج العلمي مهملاً", وأن الأنماط والعلاقات المتضمنة داخل 
البيانات الكبيرة تقدم بشكل متأصل معرفة مهمة وثاقبة عن العمليات الاجتماعية, 
والسياسية» والاقتصادية. والظواهر المعقدة. وقد أكد ذلك قائلا: 
هناك الآن طريقة أفضل. فالبيتابايت تسمح لنا بأن نقول: "إن الارتباط كاف" 
(طعنام2ه 15 طمتاداء:001). ومكننا أن نتوقف عن البحث عن النماذج. وفكننا 
أيضَا أن نحلل البيانات بدون أي افتراضات بشأن ما يمكن أن يظهره التحليل لنا. 
ويمكننا أن نرمي الأرقام في أكبر تجميعات الإحصاء التي شهدها العالم يوماًء وأن 
ندع الخوارزميات الإحصائية تجد الأنماط إذا كان العلم لا يستطيع إيجاد هذه 
الأماط... فالارتباط يحل محل السببية» ويمكن للعلم أن يتقدم ويتطور حتى 
بدون النماذج المترابطة أو النظريات الموحدة: أو أي تفسير آلي على الإطلاق. لذاء 
لا يوجد أي سبب للتعلق بالطرق القدية. 


لفل ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها 


إعادة صياغة بحوث العلوم, والعلوم الاجتماعية» والعلوم الإنسانية 


وعلى نحو مشابه. أكد (2009) 07لود2:6 على أنه "مم يعد يتعين على العلماء الآن القيام 
بتخمينات تنم عن الثقافة, أو أن يقوموا بتأسيس افتراضات ونماذجء ويختبروا هذه الافتراضات 
وتلك النماذج من خلال التجازي والأيفلة الحسمدة عان الباتاهر فيدلا من ذلك يمكنهم 
التنثقيب في المجموعة الكاملة من البيانات بحثاً عن الأنماط التي تُظهر التأثيرات وثُقدم 
النتائج العلمية بدون إجراء أي تجريب إضافي". ومن ثم فلقد أكدت (2012) عداء:ز12 أن: 
"التنقيب في البيانات الكبيرة يكشف العلاقات والأنماط التي مم نكن نعرفها كي نبحث عنها". 
واستمرت في الادعاء قائلة: "هذه الأنماط محددة للغاية وتبدو وكأنه تم التحكم في تحديدها 
من خلال الافتراضات". وبالمثل: أكد (2013) صةدملدء]5, على ما يلي: 


يتيح منهج البيانات الكبيرة تجاه جمع المعلومات المبني على ا معرفة للمحليين 
الحصول على القرار الكامل فيما يتعلق بالشئون عالية النطاق. فلا يتم فقد أي 
شيء عند النظر عن قرب بالغ إلى جزء واحد محدد من البيانات؛ ولا يتم فقد أي 
شيء عند محاولة الحصول على منظور واسع للغاية بشأن موقف حيث تم فقدان 


البيانات» ولا يجب على المحلل أن يزعج نفسه حتى بطرح افتراض بعد الآن. لقد 

تحول دورها من دور استباقي إلى دور تفاعلي. حيث إن الخوارزميات هي من 

تقوم بالعمل السياقي... فالخوارزميات ستقوم بتحديد الأماط ثم تقوم بوضع 

النظريات, ولذا فهناك حاجة متناقصة للقلق بشأن وضع افتراض في البداية ثم 

اخعبار هذا الاقتراض من خلال غينة من البيانات. 

وغيازة لفرئ: قنرلا من شان إذا ها كافت يعض الأماظ اللفترفنة المضيية أو العلاقات 
فونه وال مجموغة رراناته فإن القوارؤهياننا منصيجة العمل ان الببائالة الكبيرة مق 
أجل اكتشاف ارتباطات ذات دلالة بين البيانات دون أن يتم توجيهها من قبل الافتراضات. 
وكما قال (2012:56) 02011: "في النموذج القديم المتسم بندرة البيانات, كان يتعين علينا 
أن نقرر ما الذي ينبغي جمعه أولاً ثم نقوم بجمعه. أما مع النموذج الجديد المتسم بوفرة 
البيانات» فنحن نقوم بالجمع أولاً ثم نسأل الأسئلة لاحقا". 


ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة, والبنى التحتية للبيانات, والنتائج المترتبة عنها أ 


الفصل الثامن 


إن الأمثلة المستخدمة في توضيح مثل هذا الموقف عادة ما تكون نابعة من التسويق 
والتجزئة. فعلى سبيل المثال» وصف (2012) 12/6 حالة سلسة تجزئة حيث قام بتحليل 
صفقات الشراء لمدة اثني عشر عاما من أجل ملاحظة العلاقات المحتملة غير ا ملحوظة بين 
المنتجات التي انتهى بها الأمر في سلة المشتريات للمتسوقين. وقد أدى اكتشاف الارتباطات 
بين البنود المعينة إلى تعيين الأماكن الملائمة للمنتج الجديد وإجراء بعض التعديلات على 
إدارة مساحة الأرفف مع زيادة تبلغ 17* في الإيرادات لكل حقيبة تسوق في الشهر التجريبي 
الأول. لم تكن هناك أي افتراضات بأن المنتج (س) على سبيل المثال غالباً ما يتم شراؤه مع 
المنتج (ص) والتي تم اختبارها فيما بعد. لقد تم بكل بساطة طرح بعض التساؤلات بشأن 
البيانات من أجل اكتشاف ماهية العلاقات الموجودة التي لمم يكن من الممكن ملاحظتها في 
السابق. وبا مثل فإن نظام التوصيات في موقع أمازون يقدم اقتراحات بشأن منتجات أخرى 
من الممكن أن يكون المتسوق مهتماً بها دون معرفة أي شيء عن ثقافة أو تقاليد الكتب 
والقراءة لذلك المتسوق. فهذا النظام يحدد. ببساطة: أنماط الشراء عبر العملاء. وذلك من 
أجل تحديد ما إذا كان الشخص (س) يحب الكتاب (ص). فمن المحتمل أنه سوف يحب 
الكتاب (ز) وذلك بالنظر إلى الأنماط الاستهلاكية له وللآخرين. 


ويزعم 26 أن هذا المنهج المفتوح للاكتشاف, بدلاً من أن يكون موجهاء يُعد أكثر 
احتمالية لكشف الأنماط الضمنية غير المعروفة, وذلك فيما يتعلق بسلوكيات المستهلك» 
والعلاقة بين المنتجات. والمخاطر المالية والتي يمكن الاستفادة منها لاحقا. وفي حين أن 
من الممكن أن يكون من المفضل توضيح أي ارتباطات موجودة داخل البيانات وما السبب 
في كون هذه الارتباطات ذات دلالة: فإن مثل هذا التفسير يعد غير ضروري بشكل كبير» 
فالمهم هو معرفة أنه يفعل ذلك. ومن ثم فلقد ادعى (90 :2013) 1ءوغ51: (هذا هو 
تأكيدي) فيما يتعلق بالتحليلات التنبئية: "نحن في العادة لا نعرف عن السببية. ونحن في 
الغالب لا نهتم بذلك بالضرورة... إن الهدف يركز بشكل كبير على التنبؤ أكثر من تركيزه 
على فهم العام... إنه بحاجة إلى أن ينجح فحسب؛ إن التنبؤ يفوق التفسير". وكما ادعى 
(33 :2011) #ععنءطص11 فيما يتعلق بهنش (ء1102). وهو موقع شبكي يقوم بتقديم 
توصيات بناء على الإجابات عن الأسئلة التي يبدو أنها لا ترتبط ارتباطا وثيقا بالأمئلة 
الأصلية التي تم توجيهها: 


نل ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة, والبنى التحتية للبياناتء والنتائج المترتبة عنها 


إعادة صياغة بحوث العلوم, والعلوم الاجتماعية» والعلوم الإنسانية 


إن التحليل لا يدعم النظرية وهو لا يقدم أي نظرية. لا توجد لدى موقع 
هنش (طاعهن11) أي فكرة م أن الناس الذين, على سبيل المثال. يفضلون ارتداء 
صندل على الشاطئ والذين م يقوموا بنفح الهندباء (نبته بريه) في العام الماضيء 
ربما يحبون هذه الأفلام الأربعة (التي تم اقتراحها لهم). فالموقع لم يكن لديه أي 
افتراضء وم يكن لديه أي تخمين. كل ما كان لديه ارتباط إحصائي فحسب. 


إن بعض برامج تحليلات البيانات يتم بيعها من أجل هذا التصور بالضبطء فعلى 
سبيل المثالء فإن البعض يدعي أن برنامج التنقيب عن البيانات والعرض البصري آياسداي 
(32501إى): لديه القدرة على اكتشاف الرؤى بشكل آي بغض النظر عن التعقيد ودون 
توجيه أي أسثئلة. ويمكن لعملاء آياسداي أن بيسدلموا أخيرا الإجابات عن الأسئلة التي لم 
يكونوا يعرفون أن يسألوها في المقام الأول. ولعرض الأمر بصورة مبسطة: فإن آياسداي هو 
«سرنديبية رقمية» بمعنى أن آياسداي لديه القدرة على اكتشاف الأشياء المفيدة مصادفة 
(من أسطورة أمراء سرنديب الثلاثة)(2013 01116). وعلاوة على ذلك» فهناك من يدعي أن 
آياسداي أزال بشكل كلي دور العنصر البشري في عملية التنقيب عن البيانات - ومن ثم 
فلقد أزال جميع التحيزات البشرية المتضمنة معه. وبدلاً من انتظار أن يتم توجيه سؤال 
إليه» أو أن يتم توجيهه إلى روابط بيانات موجودة معينة» فإن النظام سوف يقوم وبدون 
توجيه باكتشاف الأنماط التي ربما لم يفكر المتحكم البشري أن يبحث عنها (2013 0121). 

إن هناك مجموعة قوية وجذابة من الأفكار التي تعمل في مثل هذه المجادلات والتي 
تجري على نحو متضاد مع المنهج الاستدلالي المسيطر والمهيمن داخل العلوم الحديثة. أولا: 
أنه يمكن للبيانات الكبيرة أن تلتقط المجال بالكامل وأن تقدم قرارا كاملا ثانا أنه الا توعد 
هناك حاجة للنظرية» أو النماذج» أو الافتراضات الاستباطية: قالثاء أده من خلال تطبيق 
تحليلات البيانات بدون دراية يمكن للبيانات أن تتحدث عن نفسها وهي متحررة من 
الصياغة والانحياز البشريينء وأن أي أنماط أو علاقات داخل البيانات الكبيرة تكون صادقة 
وهادفة بشكل أصلي. رابعا: أن المعنى يتجاوز السياق أو المعرفة المرتبطة بالمجال. 


فهذة الأمور تعمل سويا لكن تشيز إل أن هناك أسلوبًا جديدّاافق الخلوم يقم تأسيسة 
وهو الأسلوب الذي تكون فيه طريقة العمل استقرائية بطبيعتهاء وبمثل هذا ادعى 
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(2009) 114 2ه ممصصهك أن "التوافر الجاهز في البيانات المتعددة يحول المناهج 
العلمية من الطريقة العلمية التقليدية التي تقودها الافتراضات إلى العلوم المعتمدة على 
الاستكشاف". وبامثل. يقترح (2011:127) ممعي طصنعء11 أن الهدف التقليدي للعلوم 
المتمثل في تكوين النظريات التي تدعمها الحقائق وتفسر الحقائق في الوقت ذاته يتحول 
في الوقت الراهن إلى "تقديم نماذج معقدة تفسر العلاقات المعقدة" حيث "في بعض 
العالاف كون من الملسصيل كنف السحون دراء عمال تأقراى معينة: ويذلا من لان 
هناك ارتباط قوي ملاحظ بين المحاكاة والعالم الحقيقي والذي ممنح الثقة بأن المحاكاة 
الأخرى سوف تقدم نتائج موثوقة". وقد ستخدم 1112512861 المثال المتعلق بوضع 
عمود على بعد متر واحد أمام أحد الأبواب في برنامج محاكاة لتدفق خروج الناس في حال 
الإخلاء والذي أدى إلى تدفق أفضلء ولكن دون وجود أي تفسير من النموذج للسبب الذي 
يجعل العمود يفعل ذلك. واقترح, بطرق أخرى متعددة: أننا لسنا بحاجة لأن نعرف السبب» 
وإنما نحتاج لأن نعرف أن العمود يفعل ذلك وأن تطبيق الفكرة سوف يساعد على إنقاذ 
حياة الناس» وقد أنتج هذا ل (26 :2013) ع1عزلى حالة تسمى "المعرفة بدون الفهم". 


مغالطات الفلسفة التجريبية (2دواءتتأمساظ 1ه وعنعدلله8 عط1): 

لا يوجد هناك أي شك بأن البيانات الكبيرة لديها. وسوف يكون لديها بشكل متزايد» 
تأثير على كيفية ممارسة وفهم العلوم. وعلى الرغم من ذلكء فإن رؤية الفلسفة التجريبية 
بشأن كيفية تكون هذا العلم الجديد تعتمد على التفكير المغالط - جميع الأفكار الأربع 
التي تعزز تشكيلها مشكوك فيها. فلربما تكون هذه الأفكار جاذبة بشكل كبيرء ولكن 
التدقيق النقدي والفلس في يكشف مشاكل خطيرة مع كل فرضية. إن من المهم أن يتم 
التحقق من كل فكرة, كل بدروها.ء قبل صياغة رؤية بديلة للعلم الذي تقوده البيانات 
والذي بمزج بين سمات الإبعاد, والاستقراءء والاستنتاج. 

أولاً: يمكن للبيانات الكبيرة أن تلتقط المجال بالكامل وأن تقدم قراراً كاملاً. حيث إن 
البيانات الكبيرة تكافح من أجل الشمولية» فمناصروها يدعون أنه من الممكن رؤية كل شيء 
داخل المجال (على سبيل المثال جميع الأنشطة على موقع تويتر. أو جميع عمليات الشراء داخل 
سلاسل امتاجر الكبيرة)» وأنه من الممكن أن نفهم بشكل كامل ما نراه (2013 1715). وعلى 
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الرغم من ذلك وكما ناقشنا في الفصول ١‏ و١‏ و4. فإن البيانات الكبيرة ربمما تسعى إلى أن تكون 
شمولية. ولكنها تشكل كلاً من التمثيل والعينة. فالواقع, أن جميع البيانات تقدم رؤى بصرية 
قليلة للعام, وليس رؤى شاملة: أي رؤى من وجهات نظر معينة باستخدام أدوات معينة, 
وذلك بدلاً من رؤى بصرية شاملة لا تخطئ (2002 لط قصة منسة :1991 ترهمتدمدة1). 
وعلاوة على ذلك. فإن المجالات تتطور وتتغيرء ومن ثم فإن البيانات الكبيرة ليس بإمكانها 
الوصول إلى كل مكانء وذلك يرجع من ناحية إلى أن البيانات الكبيرة لا يمكنها الإلمام بجميع 
الأماكن والأزمنة»ء ومن ناحية أخرى؛ فإن الكثير من الأماكن والأزمنة الجديدة تبقى لكي يتم 
اختراعها (128 :2002 قط" 250 سندصث). وعلى هذا النحوء تشكل البيانات الكبيرة "سلسلة 
من الأوامر الجزئية والكليات المتمركزة. مع مقدرتها على التحديق في بعض الاتجاهات دوناً عن 
الأخرى" (05اه8.آ والمقتبس في 92 :2002 1146" 0ه صنسسة)؛ ومن ثم فلقد استنتج (7715 
73 "أنه من المهم أن نتذكر أن ما نراه تتم صياغته من قبل ما نحن قادرون على رؤيته أو 
في الواقع ما نريد رؤيته من خلال إطار عمل فكري محدد". 

ثانياً: أنه لا توجد هناك حاجة للنظرية: أو النماذجء أو الافتراضات الاستنباطية. الافتراض 
هنا هو أن تكوين البيانات وتحليلات البيانات واللذان يعززان استخدام البيانات الكبيرة 
يبدو أنهما يأتيان من لا شيء, وأنهما بشكل ما متحرران من "القوة التنظيمية للفلسفة" 
(8 :2011 تودء8). فالأنظمة المتناقضة تصمم من أجل التقاط أنواع معينة من البيانات, 
تقالباتما يعمل ذلك من لعل أغراضي نفحددة للغاية ون التحلياقة والكواوزفياته اللخ 
تدعمان البيانات الكبيرة تعتمدان على الاستدلال العلمي وأنه تم صقلها من خلال الاختبار 
العلمي. فالعديد من الأفكار المستخدمة في تصميم نظم البيانات الكبيرة مستمدة من 
الأدبيات العلمية واسعة النطاق والتجارب والمعارف لهؤلاء الذين يعملون على النظام. 
إن هناك الكثير من الوقت ال مستنفد في اختيار واختبار طرق متعددة لتحديد واستخلاص 
القيمة من البيانات المنتجة» وتقييم النتائج وتطويع التحليلات. وهناك جدول أعمال 
يقود مثل هذا العمل وذلك فيما يتعلق بمماهية النتائج المرجوة (زيادة دوران رأس امال أو 
الأرباح» أو فهم نظام معينء إلخ)» والذي يستفيد من النظريات المبرهنة» وذلك فيما يتعلق 
بماهية الطرق الملحوظة لتحقيق مثل هذه التأثيرات, وما إذا كانت مثل هذه التأثيرات 
تحدث في الواقع ثم يتم اختبارها بعد ذلك. 
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وكما أشار (2012) 1[[عدمع.كآء فإن الإستراتيجية الاستقرائية لتحديد الأنماط داخل 
البيانات عادة ما يقودها الاستدلال العلميء وهي لا تحدث فراعًا علميًا. أو, كما ذكر 
(2012) هعأصنه0): "لا يممكن تقديم التفسيرات ببساطة من التحليلات الإحصائية, وذلك 
دون الحاجة إلى نظرية سابقة من نوع ما". وقد أتبع ذلك قائلاً: "كونك منقادا بالبيانات 
يعد أمراً مفيداً فحسب إذا كان لديك نظرية قوية يمكنك من خلالها أن تستمر في طريقك, 
إن أي شيء الى سيوف ركاف مفهيا إلى منحدر دون أن تراه". فالواقع, أن كلا من الاستدلال 
الاستنتاجي والاستقرائي يتم تشكيلهما وما بشكل استطرادي ولا ينشأ أحدهما من لا 
شيء. ومن ثم فقد اقترح (1979) 1»مم20. مقتبس من (2012:74) غسدطء211© أن 
جميع العلوم تطبق منهج الأضواء الكاشفة على الاكتشاف العلميء حيث يكون تركيز 
الي منقادا من خلال النتائج السابقة والنظريات والتدريبء وكذلك من خلال التخمين 
المؤسس على التجارب وال معارف. إن الأمر ذاته ينطبق على أمازون (2200متة) وهنش 
(طعصنطط). وآياسداي (501دتوثى). وحجوجل (ع60081). فالكيفية التي اعتمد عليها أمازن 
في بناء نظام التوصيات على الاستدلال المنطقيء كانت مُعززة من خلال نموذج إرشادي 
يرافقه اختبار تجريبي تم تصميمه من أجل تحسين أداء الخوارزميات التي يستخدمها. 
وبالمثلء فإن جوجل يقوم ببحوث وتطوير واسع النطاق. وهو يعمل بالشراكة مع العلماء 
ويشتري ال معرفة العلمية.ء سواء تم هذا من خلال تمويل البحوث داخل الجامعات أو من 
خلال شراء المعرفات الإلكترونية للشركات الأخرىء وذلك من أجل تنقية وتوسيع المنفعة 
بشأن كيفية تنظيمه: وتقدممه. واستخلاصه للقيمة من البيانات. ونتيجة لذلكء فإذا وجدت 
القوارزنيات التهضائة أفناها في البيانات» فإن ذلك يعود إلى أنه تم استخدام علم التعرف 
على الأقفاط: جنبا إلى جنب مع المحرفة الخاصة بالمجال: 
ثالثاً: يمكن للبيانات أن تتحدث عن نفسها وهي متحررة من الصياغة والانحياز البشريين 
إن المفهوم القائل بأن إنتاج المعرفة من البيانات الكبيرة يحدث بشكل غير مرتبط بالعلم, 
هو على علاقة بالفكرة القائلة بأن تحليلات البيانات الكبيرة تمكن البيانات من التحدث عن 
نفسهاء وهي غير مثقلة بالسياقية أو أهواء التوضيح البشري. فليس فقط إنتاج البيانات 
هو ما يتم بشكل افتراضي ومتحرر من النظرية. فحتى تفسير ومعاني تلك البيانات يمكن 
بطريقة مشابهة أن يحدث في فراغ علمي, فمثل هذا المفهوم يعد سمة من سمات التفكير 
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التجريبي» وهو أنه عندما يتم تقديم وتحليل البيانات بطريقة ملائمة» فإن البيانات» بنفسها 
عق تنسواء فشكل :دلناا للها وزنيظ وكلااكرة أو حملية معيتة يدا مق تقبدييفا وفي حالة 
البيانات الكبيرة فإن حجم البيانات يضيف إلى أهمية الدليل. فهذا "التقديس" للبيانات 
يمكن أن يؤديء كما ادعى (2013) 5طك1مع1: إلى حتمية البيانات في المناقشات التي تتم 
من أجل البيانات الكبيرة. وهذا يعني أن البيانات تتفوق على النظرية» وأن البيانات أمر 
حقيقيء في حين أن النظرية ليست حقيقية (2013 112165). وأن البيانات تقول الحقيقة في 
حين أن النظرية مجرد تلفيق. وهناء يوجد ثلاث قضايا يتعين التفكير فيها: القضية الأولى 
هي افتراض أن البيانات موضوعية» ومحايدة» ومتحررة من التحيز البشري. القضية الثانية 
أن الأنماط والعلاقات داخل البيانات الكبيرة هادفة وصادقة بشكل متأصل. القضية الثالثة 
أن تفسير مثل تلك الأنماط والعلاقات يفتقر إلى أي نوع من الوضعية والموقعية. 

وكما ناقشنا في الفصل الأولء فإن البيانات ليست ببساطة عناصر محايدة أو طبيعية 
بحيث يتم فصلها عن العام بطرق محايدة وموضوعية» ويمكن قبولها بالقيمة الاسمية. 
فالبيانات لا توجد قبل تكوينها ولا تنشأ من أي شيء. ولكن الأحرىء أن البيانات يتم إنشاؤها 
داخل مجاميع البيانات المعقدة التي تشكل تركيبها بشكل فعالء ولا يمكن للبيانات في هذه 
الحالة التحدث عن نفسهاء ولكنها على الدوام تتحدث؛ بشكل متأصلء من وضعية معينة 
(2013 01571010 ) . وعلاوة على ذلكء. فإن ادعاء (2008) 2هو1ءع0 طم بأن الارباط يفوق 
السببية يشير إلى أن الأنماط الموجودة داخل مجموعة البيانات ذات معنى بشكل متأصل. 
وهذا افتراض يعرف جميع الإحصائيون المدربون أنه خطر وغير صحيح. فالارتباطات بين 
المتغيرات داخل مجموعة البيانات يمكن أن تكون عشوائية بطبيعتها ويوجد بينها ارتباط 
عرضي قليلء أو لا يوجد هذا الارتباط على الإطلاق (انظر الفصل التاسع). إن تفسير أي 
ارتباط على أنه ذو مغزى ربما يؤدي في هذه الحالة إلى مغالطات بيئية خطيرة. ويمكن أن 
يتفاقم هذا الأمر في حالة البيانات الكبيرة» وذلك يرجع إلى كون الموقف التجريبي يظهر 
وكأنه يعزز ممارسة تجريف البيانات - البحث عن أي ارتباط - ومن ثم يزيد من احتمالية 
اكتشاف ارتباطات عشوائية. وعلى الرغم من ذلك. ففي حين أن التعرف على الأنماط 
ربمما يحدد علاقات شيقة محتملة: إلا أن صحة هذا الأمر تستلزم اختباره على مجموعات 
بيانات أخرى وذلك من أجل التأكد من مصداقيتها وصحتها. وبعبارة أخرىء يتعين أن 
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تشكل العلاقات أساس الافتراضات التي يتم اختبارها على نطاق أوسع: والتي تستخدم بعد 
ذلك من أجل بناء وصقل النظرية التي تفسرهاء ومن ثم فإن الارتباطات لا تفوق السببية, 
ولكنها بالأحرى يجب أن تشكل أساس بحوث إضافية من أجل معرفة ما إذا كانت مثل 
هذه الارتباطات دالة على السببية: وفي هذه الحالة فقط مكننا أن ندرك مدى مغزى أسباب 
الارتباط. 

وفي حين أن الفكرة القائلة بأن البيانات تتحدث عن نفسها وهي متحررة من التحيزات 
أو أن الصياغة ربما تبدو وكأنها فكرة جاذية» إلا أن الواقع مختلف إلى حد ما. فبحسب ما 
أشار (160 11)1ناه60. فإن "البيانات غير الحية لا بمكنها أبداً أن تتحدث عن نفسهاء 
ونحن 5 نحاول أن نوجه بعض إطار العمل المفاهيمي» سواء كان يديا ومشكلا بصورة 
سيئة: أم مركبًا بشكل محكم ومنهجيء نحو مهمة الاستقصاء. والتحليل. والتفسير". إن 
فهم البيانات دوما مؤطر؛ ويتم فحصها من خلال منظور معين يصوغ كيف تتم ترجمتها, 
وحتى لو كانت العملية مؤتمتة بطريقة ماء فإن الخوارزميات ا مستخدمة للعالجة البيانات 
عادة ما تكون متشبعة بقيم معينة وتكون مقترنة بالسياق داخل منهج علمي معين. 
وكما أوضح (2013) و2216: فإن "أي اختبار إحصائي أو خوارزمية تعلم آلي تعبر عن 
منظور ماهية النمط أو النظام.. . فأحد الخوارزميات سوف تحجد 57 ماء في حين تجد 
خوارزمية أخرى شيئاً آخر" . فإذا ترجم ذاك شخص ماء فسيكون من المحتم أن يستفيد 
من معرفته» ومهاراته. وحدسه المتراكم من أجل تنقية رؤاه. حتى يقوم محلل مختلف 
حر ع بادا ون نفس لبك باه فالفهم أو التفسير يتشكل في العادة من خلال 
أعين ا لمشاهدين بخ بغض النظر عن ادعائهم أنهم محايدون أو متحررون من القيمة الناتجة, 
وغلذوة على ذلك. فإن التفسيرات ليست ثابتة» فهي تتغير كلما تعرضت إلى معارف جديدة 
من خلال بحوث, أو مناقشات. أو مجادلات إضافية. وعلى هذاء فإن البيانات لا تتحدث 
عن نفسها أبدا» وكما ادعى (9 :2012) 5117©17: "نحن نتحدث بالنيابة عن البيانات". 


زافا: امعنى يتجاوز السياق أو المعرفة ا مرتبطة با مجال. إن من الجوانب المرتبطة 
بالفكرة القاتلة بأن البيانات تتحدث عن نفسها ا مفهومٍ القائل بأن تفسير البيانات الكبيرة 
لا يتطلب معرفة سياقية أو مرتبطة بمجال معين. وبدلا من ذلك, فالمهم هو المقدرة على 
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توضيح ال معنى داخل البيانات. فبسبب أن البيانات من المفترض أن تتحدث عن نفسهاء 
يمكن لأي شخص ذو فهم معقول بالإحصاء أن يكون قادراً على تفسيرها. إن هناك شكوكًا 
قليلة فيما يتعلق بأن علماء البيانات والحاسب والعلماء الآخرين يتحركون داخل نطاق 
تخصصات بعضهم البعض مع انتشار البنى التحتية للبيانات والحوسبة. وفي الكثير من 
الحالات» فإنهم لا يقدمون أدوات جديدة فحسب. ولكنهم يشتركون بفعالية في تفسير 
البيانات. ومع ذلكء فإن هؤلاء العلماء لديهم القليل من الفهم المعمق في المجال المناط بهم 
وكذلك بالنظريات التجريبية المتعمقة والمعارف التي تم تأسيسها عبر فترات زمنية طويلة. 
فعلى سبيل المثال؛ فيما يتعلق بالعلوم الاجتماعية والإنسانية: فإن الأساليب الجديدة من 
التحليلات والبنى التحتية للبيانات توجه من قبل علماء الحاسب والفيزياء. وفي الغالب 
تجعل النتائج أولئك المتشربين لوجهة النظر التخصصية يستسلمون وينقادون لهذه النتائج. 

ولتوضيح هذا الجانبء فإن المجال الناشئ للفيزياء الاجتماعية. والذي من خلاله يقوم 
الفيزيائيون وآخرون باتخاذ قرارات بشأن العمليات الاجتماعية والمكانية بناءً على تحليلات 
البيانات الكبيرةء وخاصة تلك المتعلقة بالمدن والقوانين المفترضة التي تعزز صياغتها 
ووظائفها (2013 تقطه.آ :2010 تاعتطع.آ:2007 .1د هك )نامع مصعم 8): غاليا ما يتجاهل 
عن عمد ثقافة علم الاجتماع الممتد لقرنين من الزمان» ويشمل ذلك تجاهل التحليلات 
الكمية والنماذج ابليقية علا بقارق كرنا من الزمان. والنتيجة هي تحليل المدن الذي يكون 
اعدواليا إن هد كين دكقها ديعتاهل تاثرات النقاقة والسيانية: والموكنة دراسن امال 
وتقاليد ثرية من العمل الذي سعى نحو فهم كيفية عمل المدن من النواحي الاجتماعية, 
والثقافيةء والسياسية. والاقتصادية والنتيجة إعادة إنتاج الأنواع ذاتها من أوجه القصور التي 
أوجدتها العلوم الاجتماعية الكمية / الوضعية في منتصف القرن العشرين (:2914 صنطاء)ك1 
3 تلاتزء]]113). وهذا ايضا يتعدى حدود التقاليد المتنوعة والثرية للإرث الفلسفي 
ويعمل على تعزيز المناهج الفلسفية التجريبية والوضعية بصفتها أفضل وسيلة لفهم ال مدن 
مع أنه من ا محتمل ألا يتفق مع هذه الرؤية النظرية إلا القليل 1ه العلوم الاجتماعية 
التي تلت عصر الفلسفة الوضعية (2013 صنطء)ك1). 
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إن هناك مجموعة متشابهة من المخاوف لدى أولثك العاملين في مجال العلوم. 
فقد أشار (2012) 5625561 على سبيل امثالء إلى أنه في العلوم البيولوجية: ادعى 
متخصصو اللمعلوماتية الحيوية الذين لديهم أسلوب معين وضيق للغاية لفهم علم 
الأحياءء أن الأرض كان يسكنها في السابق الأطباء السريريون وعلماء الأحياء التجريبيون 
والجزيئيون. وأشار إلى أن: "تحويل التحليل إلى البيانات الرقمية... يُفسح المجال أمام 
الأسئلة المعرفية كتلك المتعلقة بمن يملك الشرعية ليكون منتجاً للمعرفة- المهتم بالآثار 
(أو الطبيب السريري أو عاط البيولوجيا الجزيئية) أو الإحصائي الذي يحلل البيانات 
ويقدم المحاكاة أو النموذج (2012: 7). ومن ثم فإن بعض علماء البيانات بدون شك 
يتجاهلون ملاحظات (2013) 2015727 وهي: 

بدون توافر خبراء في موضوع البحث من أجل توضيح المشاكل مسبقاء فسوف 
نحصل على نتائج ضعيفة... وبدون شك فإن هناك حاجة إلى خبراء في موضوع 
البحث من أجل تقييم نتائج العمل وخاصة عندما يتعامل الفرد مع بيانات حساسة 

عن السلوك البشري. وبوصفنا علماء بيانات. فنحن مؤهلون بشكل جيد للتعامل 

مع "ماذا" فيما يتعلق بالبيانات, ولكن لا يجب علينا إلا فيما ندر التعامل مع سؤال 

"ماذا" فيما يتعلق بالموضوعات التي لا نكون خبراء فيها. 

وكما أشار 2015026: فإن المطلوب بالفعل هو أن يعمل علماء البيانات وخبراء 
النطاق مع بعضهم البعض من أجل التأكد من أن تحليلات البيانات ا مستخدمة مفهومة 
وأن النتائج من مثل هذه التحليلات يتم تفسيرها بعقلانية وسياقية. وبالمثل» يدعو 
(11 - 10 :2009) .21 غء ء1,22 إلى التعاون بين علماء الاجتماع الضالعين إحصائيا وبين 
علماء العاتي الشالفيع حانونياء (11-13012009)نوشيما ضاق بالأعيال» اذغ 
(2013) .21 © 11اعصذة3 أن فرق علماء البيانات ينبغي أن يعملوا مع خبراء عمليات 
الأعمال من أجل الاستفادة من الرؤى المناسبة (انظر أيضًا الجدول .)9-١‏ 


العلم المقاد بالبيانات (ععمعك5 مع 5تعل-124): 
يسعى العلم المقاد بالبيانات, بدلاً من كونه متجذراً في الفلسفة التجريبية: إلى التمسك 
بمعتقدات الطريقة العلمية,. ولكنه أكثر انفتاحاً لامتخدام مزيج مختلط من المناهج 
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الاستدلالية» والاستقرائية» والاستنتاجية» من أجل تطوير فهم الظاهرة. وهذا يختلف عن 
التصميم الاستدلالي التجريبي التقليدي في أنه يسعى إلى طرح افتراضات ورؤى يتم توليدها 
من البيانات بدلا من توليدها من النظريات (613 :2009 .21 أ عوصتلاعآ). وبعبارة 
أخرى. فهو يسعى إلى دمج أسلوب من الاستقراء في تصميم البحوثء وذلك على الرغم 
من أن الشرح من خلال الاستقراء ليس هو الغاية المستهدفة (كما هي الحال مع المناهج 
الععريية ).. ديدلا فق ؤتاقه فين يكل أشستلويا عنيدا مق اندالبب توليد القرضيات قبل 
استخدام ال منهج الاستنتاجي. ولا تنشأ عملية الاستقراء من لا شي ولكنها تقع وتقترن 
بسياق نطاق نظري متطور للغاية. ومن ثم, فإن الإستراتيجية المعرفية المتبناة داخل العلم 
المقاد بالبيانات هي استخدام أساليب موجية لاكتشاف المعرفة من أجل تحديد الأسئلة 
(الافتراضات) المحتملة الجديرة باختبارات وبحوث إضافية. 


فالعملية يتم توجيهها من ناحية أن النظرية الحالية تستخدم من أجل توجيه عملية 
اكتشاف المعرفة, وذلك بدلا من أن نأمل ببساطة أن نحدد جميع العلاقات داخل مجموعة 
البيانات وأن نفترض أنها ذات معنى بطريقة أو بأخرى. ومن ثم فإن كيفية تكوين 
البيانات أو إعادة تحديد الغرض منها تقوده افتراضات معينة تعززها خبرات ومعارف 
عملية ونظرية: مثل ما إذا كانت التقنيات وإعدادها سوف تلتقط أو تنتج مواد بحثية 
مفيدة وملائمة. فبدلاً من إنتاج البيانات بأي وسيلة ممكنة: وذلك باستخدام أي نوع من 
التقنيات المتاحة أو أي نوع من أطر التمثيل يتم التفكير بعناية في إستراتيجيات تكوين 
البيانات وإعادة توظيفهاء مع اتخاذ قرارات إستراتيجية من شأنها أن تؤدي إلى أنواع معينة 
من البيانات. وعلى نحو مشابه. يتم توجيه كيفية معالجة وإدارة وتحليل هذه البيانات 
من خلال الافتراضات المتعلقة بماهية الأساليب التي ربما توفر رؤى هادفة. فالبيانات لا 
يمكن إخضاعها لأي صياغة وجودية ممكنة: ولا يمكن إخضاعها كذلك لأي نوع من أساليب 
القبي عن البياناك» غلك آمل أنها وماكفة عض العفافق اللحفية ويذلا فى ذلك 
يتم اتخاذ القرارات المبنية على النظرية بشأن الطريقة الأمثل للتعامل مع مجموعة البيانات 
حتى يمكنها أن تكشف المعلومات التي ربما تحمل فائدة محتملة وتكون جديرة ببحوث 
إضافية. وبدلاً من اختبار صحة أي علاقة يتم كشفهاء فإن الاهتمام يتركز على تلك العلاقات 
-بناءً على بعض المعايير - التي يبدو أنها تؤدي إلى المسار الصحيح أو من اللمحتمل بشكل 
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أكبر أن تؤدي إلى ا مسار الصحيح. وف الواقع, فإن الكثير من العلاقات المفترضة داخل 
مجموعات البيانات يمكن تنحيتها على أنها تافهة أو سخيفة من قبل متخصصي المجالء في 
حين يتم وسم البعض الآخر على أنها تستحق اهتماماً إضافياً (2010 :21111 .[.51). 

إن مثل عملية اتخاذ القرار هذه فيما يتعلق بطرق توليد البيانات والتحليل تعتمد على 
التفكير الاستدلالي. والاستدلال هو وسيلة للاستنتاج والتفكير المنطقي تم وضعه بواسطة 
0 211111 .[.81) (1914 - 1839) ععنزءط .0.5). ويهدف الاستدلال إلى خاتمة تكون 
ذات معنى منطقي ومعقولء ولكنها ليست حاسمة في ادعاءاتها. فعلى سبيل المثالء لا 
توجد أي محاولة لاستنتاج ما هي أفضل طريقة لتوليد البيانات» ولكن يمكن بدلاً من ذلك 
تحديد طريقة ذات معنى منطقي بالنظر إلى ما هو معروف بالفعل عن إنتاج مثل هذه 
البيانات. ويستخدم الاستدلال بشكل شائع في العلوم وخاصة في تشكيل الافتراضات» على 
الرغم من أن مثل هذا الاستخدام غير معترف به على نطاق واسع. ولذاء فإن أي علاقات 
يتم كشفها داخل البيانات لا تنشأ من لا شيء. ولا تتحدث عن نفسها ببساطة كذلك. إن 
عملية الاستقراء - للرؤى الناشئة من البيانات - تتم صياغتها بشكل سياقي. وهذه الرؤى 
ليست نهاية مطاف الاستقصاء إذ يتم ترتيبها وتفسيرها من خلال نظرية ما. وبدلاً من 
ذلكء فإن الرؤى توفر الأماس لتشكيل الافتراضات والاختبار الاستنتاجي لصحتها. وبعبارة 
أخرىء يُعد العلم المقاد بالبيانات نسخة معاد تشكيلها من الطريقة العلمية التقليدية» مما 
يوفر وسيلة جديدة لبناء نظريةء وإضافة إلى ذلكء فإن التغيير المعرفي هو هادف بحد ذاته. 


ويدعي البعض أن العلم المقاد بالبيانات سوف يصبح النموذج الجديد للطريقة العلمية 
في عصر البيانات الكبيرة والمتدرجة لأن التفضيل المعرفي يتناسب مع استخلاص رؤى إضافية 
وقيمة سيفشل العلم التقليدي المقاد بالمعرفة في توليدها ([.11 :2009 .21 اء عصنلاء؟1 
0 111065ه.1 :2012 1411161). إن العلم المقاد بال معرفة. عند استخدامه منهج استنتاجي 
مباشرء له فائدة معينة في فهم وتفسير العالم تحت ظروف البيانات النادرة والحوسبة 
الضعيفة:. ولكن الاستمرار في استخدام مثل هذا النهج لا يبدو أنه مفهوم بشكل كلي 
عندما تشير التطورات التقنية وال منهجية إلى أنه من الممكن الاضطلاع بتحليلات أكثر ثراءٌ 
للبيانات - تطبيق تحليلات جديدة للبيانات وتوفر القدرة على ربط بيانات كبيرة ومتفاوتة 
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سوياً بطرق كانت غير ممكنة لوقت قريبء والتي تقدم بيانات جديدة قيمة - والتحديد 
والتعامل مع الأسئلة بطرق جديدة ومؤثرة. فالعلم المقاد بالبيانات. بحسب ما يتم نقاشه. 
يتناسب أكثر مع استكشاف واستخلاص القيمة وفهم مجموعات البيانات الهائلة والمترابطة, 
وتعزيز البحوث متعددة الاختصاصات التي تدمج خبرات المجال من خلال الإطار النظري 
الاستهلالي كونها أقل محدودية.ء وسوف تؤدي إلى نماذج ونظريات أكثر شمولية وعمومية 
للأنظمة المعقدة بالكامل يدلة من عناصر منها (2009 .21 غء وصنلاء؟]). 


فعلى سبيل المثالء يدعي البعض أن العلم المقاد بالبيانات سوف يحول فيهمنا عن 
الأنظمة البيئية (2009 .21 اء عصنصطء.آ :2008 .21 »© غصهتر8). وسوف يتيح إمكانية 
التكامل بين بيانات آنية ولحظية وعالية الدقة وذلك في سبيل تقديم نماذج تفصيلية للبيئة 
المتغيرة على النحو الذي يتعارض مع نقاط ثابتة غير متغيرة عبر المكان والزمان. ويقصد 
هنا التكامل بين البيانات التي يتم توليدها من العديد من ا مصادر كمحطات الطقس 
التقليدية والمتحركة: والأقمار الصناعية والتصوير الجويء ورادارات الطقس. ومحطات رصد 
التيار. ومحطات القياسء وملاحظات المواطنين» والاستشعار الجوي واختبار جودة اطياه 
ومقاييس الغازء وفحص التربة. والحساسات الموزعة التي تقيس الظواهر المختارة مثل 
درجة الحرارة والرطوبة. ومن شأن ذلك التكامل أن يسهم في تحديد العلاقات الخاصة 
بين الظواهر والعمليات التي تولد افتراضات ونظريات جديدة يمكن اختبارها بعد ذلك 
من أجل التحقق من صحتها. وهذا سوف يساعد أيضًا على تحديد وفهم نقاط الربط 
بين مجالات بيئية مختلفة مثل الغلاف الجوي (الجو). والغلاف الحيوي (الأنظمة البيئية)» 
والغلاف المائي (أنظمة المياه). والقشرة الأرضية (القشرة الصخرية للأرض)» والغلاف الترابي 
(التربة)» والمساعدة على دمج النظريات في مجاميع نظرية أكثر شمولية. ومن شأن هذا 
أن يوفر فهماً أفضل للعمليات المترابطة والمتنوعة في أرض الواقع والعلاقات الترابطية بينها 
وبين الأنظمة البشرية: ويمكن استخدامه كذلك من أجل توجيه النماذج والمحاكاة من أجل 
التنبؤ بالاتجاهات طويلة المدى والإستراتيجيات التكيفية ال ممكنة. 
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العلوم الاجتماعية الحاسوبية والعلوم الإنسانية الرقمية 
(1165تطتة ةط 1ه 1م101 لمعه دععمعك5 لم501 210221] امامت ): 

في حين أن معرفية العلم المقاد بالبيانات تبدو كما لو كانت وضعت لتحويل منهج 
البحث المطبق في العلوم المادية. والطبيعية» والحياتية» والهندسية, إلا أن مسارها في العلوم 
الاجتماعية والإنسانية يبدو أقل تأكيداً. فهذه المجالات من العلوم متنوعة بشكل كبير في 
أسسها الفلسفيةء وخاصة مع قيام عدد قليل فقط من العلماء في هذه المجالات بتوظيف 
المعرفة المشتركة بين العلوم. فهؤلاء الذين يستخدمون الطريقة العلمية من أجل تفسير 
ونمذجة الظواهر الاجتماعية. بشكل عام. يستفيدون من أفكار الفلسفة الوضعية (على 
الرغم من أنهم ربمما لا ييستخدمون مثل هذا العنوان» 2006 62ء:1؟1). ومثل هذا العمل 
بميل إلى التركيز على المعلومات الواقعية والكمية - الظواهر المشاهدة تجريبياً والتي يمكن 
قياسها بشكل فعال كالأعداد واللمسافات والتكلفة والوقت على النحو الذي يتعارض مع 
المجالات الأكثر مادية من الحياة الإنسانية مثل المعتقدات والأيدولوجيات - باستخدام 
الاختبار الإحصائي من أجل تأسيس علاقات سببية وبناء النظريات والنماذج التنبئية 
وا محاكات. فالمناهج الوضعية مؤسسة بشكل جيد في الاقتصاديات, والعلوم السياسية, 
والجغرافيا البشرية» وعلم الاجتماع: ولكنها نادرة بشكل كبير في العلوم الإنسانية. وعلى 
الرغم من ذلكء فداخل هذه التخصصات المذكورة, كانت هناك حركة قوية خلال النصف 
الأخير من القرن الماضي تجاه المناهج ما بعد الوضعية, وخاصة في الجغرافيا البشرية وعلم 
الاجتماع. 

وفيما يتعلق بعلماء الوضعية في العلوم الاجتماعية: فإن البنى التحتية للبيانات» والبيانات 
المفتوحة والبيانات الكبيرة توفر فرصاً هائلة من أجل تطوير نماذج أكثر تطوراً وأكثر دقة وعلى 
نطاق واسع للحياة الإنسانية. فثورة البيانات توفر إمكانية الانتقال من دراسات ال مجتمعات 
التي تتسم بالندرة في البيانات إلى الدراسات الثرية في البيانات, ومن اللقطات الثابتة إلى 
الانتشار الديناميي: ومن التجميعات الرديئة إلى الدقة العالية ومن النماذج البسيطة نسبياً 
إلى محاكاة أكثر تعقييدا وقطور (2013 طعطءة]1). إن هناك احتمالية لعصر حديد من 
العلوم الاجتماعية الحاسوبية التي تجري دراسات ذات اتساعء» وعمقء ومدىء وإطار زمني 
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أكبر بكثيرء وهي تغطي فترات زمنية متعددة بشكل متأصلء وذلك على النقيض من بحوث 
العلوم الاجتماعية الحالية (2012 .21 اه 67غة8 :2009 .21 اء مرعههآ). وعلاوة على ذلك. 
فإن حجم. وصحةء وتنوع: وشمولية» ودقة: وارتباطيةء ومرونة: وتوسعية البيانات» بالإضافة 
إلى القوة المتزايدة للحوسبة وتحليلات البيانات الجديدة» تتعامل مع بعض انتقادات علماء 
الوضعية حتى اليوم. وخاصة تلك المتعلقة بالاختزالية والشمولية, وذلك من خلال تقديم 
تحليلات أكثر دقة وحساسية والتي يمكنها أن تهتم بالسياق والاحتمالية» ويمكن استخدامها 
من أجل صقل وتوسيع الفهم النظري للعام الاجتماعي المكاني. وعلاوة على ذلكء وبالنظر 
إلى شمولية البيانات. فمن ال ممكن اختبار صحة مثل هذه النظرية عبر العديد من المواقف 
والبينات. وفي مثل هذه الظروفء فإن المعرفة عن الأفراد. والمجتمعات, والجماعات, 
والبيئانت سوف تصبح أكثر ما وتفع] وذلك فيما يتعلق بصياغة السياسة والتعامل مع 
القضايا المتعددة التي تواجه البشرية. إن التحدي الكامن في مثل هذا السيناريو لم يعد هو 
البيانات» 00 اا طرق إحصائية ونمذجة جديدة لها المقدرة على التعامل مع ملايين 


الكثير مدي حدهدا كوسائل القواضيل الالجتماعى: والكثير 58 كان ه من د الوصول 
إليها في السابق كملايين الكتبء والمستندات» والصحف. والصور, والأعمال الفنية» والأشياء 
المادية... إلخ من عبر التاريخ والتي تم تحويلها إلى الصيغة الرقمية خلال العقدين السابقين 
من خلال مجموعة من المنظمات) (2008 «عطه0)؛ وإتاحة أدوات جديدة لمعالجة وإدارة 
وتحليل البيانات؛ وتوفر وسائل جديدة لتعزيز التعاون بين مختلف التخصصات وتجاوز 
نموذج العام الواحد؛ وتوسعة الروابط البحثية مع المؤسسات غير الأكادمية وتضمين جمهور 
جديد على نطاق أوسع (2008 5:70:4). وتخضع هذه الفرص للدراسة على نطاق واسع 
من خلال الخال التاهخ للإنسانيات الرقمية:والذق يجمع العلماء سورا من جميع العلوم 
الإنسانية كا مؤرخينء واللغويينء والفنانين المبدعين» وعلماء الأدب والإعلام... إلخ مع أخصائي 
المكتبات» وعلماء الحاسبء والبيانات» والمعلومات. 
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وبشكل مبدثيء فإن العلوم الإنسانية الرقمية تتشكل من معالجة وتحليل البيانات 
التي تكونت في الأصل بشكل رقميء ورقمنة وأرشفة ال مشروعات التي تسعى إلى تحويل 
النصوص وال مواد التناظرية إلى صيغ رقمية بحيث يمكن تنظيمها والبحث فيها وإخضاعها 
لأشكال أساسية من التحليلات الآلية. والموجهة. والشاملة. مثل العروض الرئية الموجزة 
للمحتوى أو الروابط بين ا مستندات, والناس أو الأماكن (2009 #عموءء2 همه ممقصطء5). 
ونتيجة لذلكء فلقد ادعى ال مؤيدون أن المجال قد تطور لكي يوفر أدوات أكثر تطوراً 
معالجة. وبحث. وربطء ومشاركة. وتحليل البيانات التي تسعى إلى إتمام ودعم طرق 
العلوم الإنسانية الحاليةء وتسهيل الأشكال التقليدية من التفسير وبناء النظرية» وذلك بدلا 
من استبدال الطرق التقليدية أو تقديم منهج وضعي أو تجريبي لعلماء العلوم الإنسانية 
(2011 طعلامصدلطا :2011 تجضعظ). 

إن ما توفره العلوم الإنسانية الرقمية هو وسيلة لمعالجة ومشاركة البيانات» وزيادة 
التحليل التقليدي» وتعزيز البحوث عبر مدى وحجم أكبر بكثير من المصادرء وتوفير الوقت 
والجهد. وبدلا من التركيز على حفنة من روايات العصر الفيكتوري أو صور من أوائل القرن 
العشرين أو اثنين من فناني عصر النهضة وأعمالهم» يصبح من ال ممكن البحث والربط عبر 
عدد كبير للغاية من الأعمال ذات الصلة؛ وبدلا من التركيز على حفنة من ال مواقع الشبكية 
أو غرف الدردشة أو الصور أو الفيديوهات أو الصحف الإلكترونية. يصبح من ال ممكن دراسة 
الآلاف من مثل هذه الوسائط. ومن ثم فلقد ادعى (2011) طعنعوصة]3 أن: "الدراسة 
العو بالعار بي السمو عاك اناق ثقاقية هافلة غادة ها تكقف أغاطا عديدة لليانات 
التي لا يمكن حتى من خلال القراءة المتأنية لأفضل دليل أن تكشفها". وبالطبع. فإن جيشاً 
من علماء العلوم الإنسانية لن يكون قادراً بشكل حريص على القراءة المتأنية لمجموعات 
بيانات هائلة في المقام الأول. وادعى (2005) 21061 أن العلوم الإنسانية الرقمية ستطبق 
الصرامة المنهجية على التخصصات التي كانت في السابق غير نظامية وعشوائية في تركيزها 
ومنهجها المتبع. وادعى أن الأدبيات ذات الصلة بالأعداد. والأشكالء والوسائط المرئية من 
المحتمل أن توفر رؤى جديدة وتضفي رونقاً جديداً على المجالات المنهكة. 
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وفي الوقت ذاته. وكما أن هناك فرصًاء هناك أيضًا مجموعة من التحديات. فبالنسبة 
للمعارضين: فإن استخدام طرق العلوم الإنسانية الرقمية الجديدة سوف تعزز ما أطلق 
عليه (2005) 21016]61 مصطلح "القراءة عن بعد" حيث ممكن لأجهزة الحاسب أن تعمل 
مثل آلات القراءة (2010 7إة2:25خ1). فمثل هذا النهج يتعارض مع ال ممارسة الراسخة منذ 
أمد بعيد والمتعلقة بتوفير قراءة متأنية للمصدر. وقد ادعى (20 :2010) 1114© على 
سبيل المثال بأن: "ما يتعارض مع القراءة المتأنية ليس القراءة عن بُعد ولكن شيئاً ما مثل 
القراءة غير المتقنة أو القراءة العرضية". واستمر قائلاً بأن القراءة المتأنية تتضمن الاهتمام 
بكيفية إنتاج أو نقل المعنىء وبنوع الإستراتيجيات والأساليب الأدبية والبلاغية ا مستخدمة 
من أجل تحقيق ما يمكن للقارئ أن يأخذ به على أنه المؤثر على العمل أو الفقرة (ص 
2» وهذا شيء لا يمكن للقراءة عن بعد أن تقوم به. فقلق 0111615 ناتج عن أن العلوم 
الإنسانية الرقمية لا تسهل أو تعزز "القراءة عن بعد" فحسب. بل إنها تجعل "من ال ممكن 
إجراء البحوث الأدبية بدون القراءة على الإطلاق: مثل إيجاد كافة الحالات التي وردت فيها 
كلمتي "يتسول" و"متسول" في روايات كتبها اثنان من المؤلفين ثم كتابة النتائج" (ص 24). 

وعلى نحو مشابه. ذكرت (164 :2009) اعطءم0ننك1” بأن: "النموذج امقاد اعضاكا 
لتاريخ الأدب... يبدو أنه يتطلب يداً مجهولة غير مرئية. وعلاوة على ذلك: فإنه يحدد 
الأماط ولكنه يتجنب تحديد السببية» والتي لا يمكن تحديدها من خلال تتبع محفوظات 
الناشرينء وقراءة مسودات ال مخطوطات الفردية في مكتبات الكتب النادرة ومحاولة فهم, 
من كتاب لكتابء. من قام بتحديد عنوان كل رواية: المؤلفء الناشرء أو وكيل الدعاية" (ص 
4. وبالنسبة لها فإن مثل هذا البحث يتضمن حركة حقيقية وليس استخدام مجموعة 
من الخوارزميات. كما أكدت أن تحليل آلاف النصوص يعني "أن أي نص معين سوف يصبح 
غير ذي صلة من الناحية الإحصائية" (ص 164). واستمرت قائلة " أي محاولة لرؤية الصورة 
بالكامل تحتاج إلى دعم من قبل المعرفة الواسعة وفهم تأريخي فطن بكيفية عمل الأساليب 
والمؤسسات الأدبية والأدوات التفسيرية القاطعة. وفي معرض تقديرها للجزافية ", اختتمت 
كلامها (ص )١17١ - ١7١‏ قائلة إنه من "المهم أن معظمنا تخلى عن الاستمرار في البقاء في 
المكتبة... فاليأس من عدم توافر المعرفة الشاملة يجب ألا يدفعنا إلى التفكير المتطرف 
المعاكس بأنه يجب علينا أن نبدأ في معالجة الأدبيات بكميات هائلة لكي نحرز أي تقدم". 
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وبالمثلء فبالنسبة ل (2012) عداء2812: فإن الآثار الثقافية مثل الأدبيات لا مكن معاملتها 
كونها مجرد بيانات. فالجزئية الأدبية المكتوبة لا يمكن أن تكون ببساطة مجرد ترتيب 
للحروف والكلماتء بل هي مقترنة بالسياق وتنقل ال معنى ولها سمات تفوق الوصف. 
فالخوارزميات ضعيفة للغاية فيما يتعلق بالتقاط وفك تشفير المعنى أو السياقء وكما 
ادعى ع3/]3 فإن الخوازميات تعامل جميع الأدبيات كما لو كانت هي نفسها. واستمر 
قائلاً: "إن التحليل الخوارزمي للروايات والمقالات في الجرائد يكون بالضرورة ضمن حدود 
الاختزالية. إن عملية تحويل الأدب إلى بيانات تزيل التفوق ذاته. وهي تزيل التذوق وتزيل 
جميع الدقة من النقد. وتزيل التاريخ المرتبط بإطلاق هذا العملء فرواية "إلى المنارة" ما 
هي إلى رواية أخرى من ضمن ركام الروايات". 

وعلاوة على ذلكء فبالنسبة للآخرين, فبدلاً من العمل على المصادر الأصلية, فإن العلوم 
الإنسانية الرقمية تتعامل مع الأشياء الرقمية» التي تنقل دفعة واحدة وتختلف من الناحية 
الكيفية عن أصولها (بمعنى أنها وصف للوصف) وذلك من شأنه أن يؤثر بشكل حتمي على 
تفسيرها. 

وبالنسبة للكثيرينء فإن العلوم الإنسانية الرقمية» في هذه الحالة. تعزز التحليلات 
السطحية الضعيفة بدلا من الرؤى العميقة المتخلخلة. ولذاء يتم نقدها على اختزاليتها 
المفرطة وعدم إتقان أساليبهاء وتضحيتها بالتعقيد. والتدقيق: والسياقء والعمق» ونقدها 
للأماط الوصفية. والآلية: وا لمدرجة: والمتسعة. والانطباع بأن التفسير لا يتطلب معرفة 
سياقية عميقة. ومن ثم, فلقد ادعى (2013) 1425د1]2 أن: "قيمة الفنون وجودة المسرحية 
أو الرسم لا يمكن قياسها على الإطلاق. فأنت بمقدورك وضع جميع أنواع البيانات في آلة: 
التواريخ» والألوان» والصورء وإيصالات شباك التذاكرء ولكن لا يمكن لأيّ منهم أن يفسر ما 
هو العمل الفني» وما الذي يعنيه. وما السبب في قوته., فالإجابة عن هذه الأسئلة تتطلب 
إنساناً وليس آلة. وفي حين أنني متأكد أن البيانات الكبيرة مفيدة, إلا أنها لا تنطبق على 
جميع مجالات الحياة البشرية» فهي لن تحسن الظروف البشرية. فالحب. والثقافة» والفن, 
والسياسة أمور ضرورية في حياتنا ولكن البيانات الكبيرة تخبرنا القليل عن هذه الأمور. 
وباختصارء لا تصدق جميع الدعايات عن البيانات» فهي ليست الإجابة عن الأسئلة الكبيرة". 
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وعلاوة على ذلكء فإن التمويل المحدود المخصص للعلوم الإنسانية تتم إعادة تركيزه 
على مشروعات العلوم الإنسانية الرقمية وذلك على حساب الدراسات الأكثر تقليدية مما 
يحرم بعض تخصصات العلم من التمويل. وتسري تأثيرات عمليات إعادة توزيع التمويل 
أيضا داخل العلوم الإنسانية الرقمية ذاتها. حيث غالبا ما يتم توجيه التمويل تجاه بناء 
البنى التحتية للبيانات وإنشاء أدوات جديدة. وذلك بدلا من تمويل مشروعات تستفيد من 
المجموعات الرقمية من أجل الإجابة على الأسئلة الأكثر جوهرية. والنتيجة توجيه التمويل 
تجاه هندسة البرمجياتء. وتطوير أدوات تحليلية. ومعداتء. ومختبرات. ومشروعات اموارد 
الأخرىء وذلك بدلاً من تمويل العلوم الإنسانية بذاتها. 

ويمكن أن تنطبق ذات أنواع المناقشات هذه فيما يتعلق بالعلوم الاجتماعية الحاسوبية. 
فعلى سبيل المثالء في مناقشة تتعلق بتأليف التصوير في ويكيبيدياء ادعت فيرناندا فيجاس 
(171685 .8 دل صددءم8) والتي تعمل في مختبر الاتصالات المرئية في (1831) أن التخطيط 
المرئي للبيانات يمكن أن "يساعد الباحثين على تحديد الأسئلة التي ربما يمكن استكشافها 
من الناحية الإحصائية - على سبيل ال مثالء ما مدى تكرار حدوث التخريبء وما مدى سرعة 
ارتداد النص؟" (مقتبس في 11 :2010 801116). وعلى الرغم من ذلكء. تعد مثل هذه 
الأشفلة نسيظة فيها. ففي هذه الحالة» رما يكشف التخطيط امرثئي أن موضوعا ما تتم 
مناقشته بحماسة بالغة والمدى الذي يمكن أن يجعل محرري ويكبيديا يتدخلون في عملية 
تحرير مدخلات البيانات, ولكن التخطيط امرثئي يفعل القليل للإجابة على الأسئلة الأكثر 
نفعاً وتشويقاً وكشفاً مثل أسباب وطبيعة النزاعات والقصص البديلة التي يتم إنتاجهاء 
ولا تتم دراسة أي منها بشكل أمثل من خلال الإحصائيات. وعلى نحو مشابه. فإن خريطة 
لغة التغريدات ف مدينة ما رما تكشف أنماط التركيز الجغرافي لجماعات عرقية متعددة, 
ولكن الأسئلة المهمة هي من يشكل مثل هذه التركيزات, وما السبب في وجودهاء وما هي 
العمليات التي أسهمت في التشكيل والتكاثرء وما هي نتائجها الاجتماعية والاقتصادية. إن 
تحديد الأنماط شيء؛ ولكن تفسير هذه الأنماط شيء مختلف تماماء حيث يتطلب نظرية 
اجتماعية ومعرفة سياقية عميقة. وفي مثل هذه الحالاتء فإن الخطر يكمن في أن البحوث 
تمارس ببساطة بسبب توافر البيانات. مما يحد بشكل كبير من الأسئلة التي يمكن توجيهها 
وذلك لأن البيانات لم يتم إنتاجها مع وجود مثل هذه الأسئلة على البال (2013 5ذ7ا). وكما 
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ادعى (2013) 8211052 50222162: "إن تخطيط التوزيع ا مكاني للمشاعر الإيجابية, أو 
التكرار الذي يتم من خلاله ذكر بعض الكلمات في التواصل على الإنترنت لا يخبرنا الكثير عن 
توافق هذه الأنماط مع الديناميكيات الاجتماعية التي تشكلها وتخلقها... إن قياس الأشياء 
بسبب أنه يمكن قياسها فحسبء لا يجعلها مشوقة أو ذات صلة". 

وفي حالات مثل خريطة التغريدات: فإن الأنماط المكتشفة نادراً ما يتعين أن تكون نقطة 
النهاية وهو ما يبدو عليه الحال في بعض المشروعات (2013 08615). والأحرى أن تمثل 
الأقاط المكتشفة منظة البداية مما يعظلى بالتاكين افتكالا أشرق من التعابلات ورها بعض 
مجموعات البيانات الأخرى. 


وكما هو الحال مع الانتقادات الأولى للعلوم الاجتماعية الوضعية الكمية: فإن العلوم 
الاجتماعية الحاسوبية يُزج بها في مهام من قبل ما بعد الوضعيين كونها آلية» ومفتتة 
ومحددة: وتقلص الأفراد المتنوعين» والبنى الاجتماعية المعقدة متعددة الأبعاد. إلى مجرد 
نقاط بيانات (107:172 منشور في الصحافة). وعلاوة على ذلك فإن التحليل يفسد من 
قبل افتراضات الحتمية الاجتماعية كما أوضح (2012) 54هلمء< ذلك بالأمثلة قائلاً: "إن 
نوعية الشخص الذي تكون عليه تتحدد بشكل كبير من قبل بيئتك الاجتماعية: ولذا إذا 
كان بإمكاني رؤية بعض سلوكياتك, فيمكنني أن أستنتج الباقيء وذلك فحسب من خلال 
مقارنتك مع الأشخاص في جماعتك". وعلى النقيض من ذلكء يدعي البعض أن المجتمعات 
البشرية معقدة للغاية وفوضوية وغير متوقعة لكي يتم تحويلها إلى صيغ وقوانين» حيث 
توفر النماذج الكمية رؤى قليلة لتفسير الظواهر مثل الحروب. والإبادة الجماعية. والعنف 
الأسريء والعنصرية. وعلى الرغم من أن البيانات الكمية يمكنها أن توضح بعض هذه 
المجالات» فإنها توفر رؤى شاملة فحسب للأنظمة البشرية الأخرى مثل الاقتصاد. وهي 
تفسر بشكل غير كاف دور السياسة. والأيدلوجياء والبنى الاجتماعية, والثقافة (7و11315 
2.272 إن الناس لا يتصرفون بطرق منطقية ومحددة أسلفاء ولكن بدلا من ذلك فهم 
يعيشون حياة مليئة بالتناقضات. والمفارقات,. والحوادث غير المتوقعة, فالكيفية التي يتم 
من خلالها تنظيم وعمل المجتمعات تختلف عبر الزمان والمكانء ولا يوجد شكل مثالي أو 
أفضل أو سمات عالية. وفي الواقع: يوجد تنوع مدهش في الأفراد. والثقافات. وأساليب 
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الحياة على الكوكب. فتقليص مثل هذا التعقيد إلى الموضوعات المجردة التي تشغل النماذج 
العالمية يؤدي إلى الكثير من العنف الرمزي فيما يتعلق بخلقنا للمعرفة. وعلاوة على ذلك, 
فإن المناهج الوضعية تتجاهل عن عمد المجالات الميتافزيقية (ما وراء الطبيعة) للحياة 
البشرية (المتعلقة با معاني» والمعتقدات. والخبرات) والأسئلة المعيارية (المعضلات الأخلاقية 
والمعنوية بشأن كيف تكون الأشياء على النحو الذي يجب أن تكون عليه مقارنة بالوضع 
الحالي لهذه الأشياء) (2006 «عطء]1). وبعبارة أخرىء فإن المناهج الوضعية تركز فقط 
على أنواع معينة من الأسئلة» والتي تسعى إلى الإجابة عنها بطريقة اختزالية تتجاهل على 
ما يبدو ما الذي يعنيه أن يكون المرء إنساناً وأن يعيش في مجتمعات وأماكن خصبة التنوع. 
وهذا لا يعني أن المناهج الكمية غير مفيدة بل هي مفيدة بشكل واضح للغاية. وخاصة 
فيما يتعلق بتفسير ونمذجة الأنظمة الآلية ولكن ينبغي فهم جوانب قصورها فيما يتعلق 
بفهم الحياة البشرية ودمجها مع المناهج الأخرى. 

ومن ثم فلقد ادعى (20136) 87001 أن تحليلات البيانات الضخمة تتصارع مع 
الطبيعة الاجتماعية كون الناس غير منطقيين ولا يتصرفون بشكل متوقع وكون الأنظمة 
البشرية معقدة بشكل غير معقول ولديها علاقات متناقضة ومتباينة. وهي تتصارع 
كذلك مع السياق كون البيانات منفصلة بشكل كبير عن السياق الاجتماعيء والاقتصادي. 
والسياميء والتاريخيء وهي أيضًا تخلق أكواماً هائلة من القش كونها تتكون من ارتباطات 
غير طبيعية هائلة للغاية مما يجعل من الصعوبة بمكان تحديد مكان الإبرة أو ما نبحث عنه 
ذكونيا تواضة مشاكل عبن مجائية المشاكل الكبيزة وعاصة اللشاكل الاقتصادية والاعفياعة. 
وهي كذلك تفضل المستنسخ على الأصل كونها تحدد الاتجاهات ولكنها لا تحدد بالضرورة 
السمات المهمة التي ربما تتحول إلى اتجاه وكونها تحجب القيم والمصالح المتعلقة بمنتجي 
البيانات وهؤلاء الذي يحللون البيانات وأهدافهم. 

وهم يفعلون ذلكء لأنه وكما قال (174 :1981) 001110 ءعغ]»2, وهو مؤيد للمناهج 
الإحصائية في تحليل البيانات: "يبدو أن رموز لغاتنا الرياضية مقيدة ومحددة بشكل كبير. 
وفي الغالب هم يحدثون أغرارا ليس لأنهم يقيدوننا فحسبء ولكنهم في الواقع يمحون من 
الوجود ما يمكن أن يكون مستحقاً لانتباهنا واهتمامنا. وإذا ما تصورناء وهذا ما نفعله في 
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الغالب, الطبيعة متعددة الأبعاد التي تصف تعقيد حياتنا المعاصرة... والفراغات الناتجة 
بواسطة الفلتر الخطي (0ع0211 تاعطنه5) ال مسمى تحليل العامل (7515[همك 1ماءة1): 
فربما نقوم بسحق المعلومات خارج الوجود وذلك تحت مسمىٍ التبسيط. إنني لست 
متأكداً تماماً من السبب وراء فعل ذلكء عدا أن لدي 556 مؤكداً تقريباً بأن توافر أجهزة 
حاسوب كبيرة وسريعة. وكذلك البرامج الجاهزة له يد في ذلك". 


وبالنسبة ل 6014. فإن فهم السلوك البشري والمجتمعات البشرية لا يمكن ولا يجب 
تحويله إلى تحليلات متكررة ومنهجية وآلية» ولقد دعا إلى التفكير المستدام بشأن أنواع 
الأماليب التي يتعين استخدامها مع أي نوع من البيانات. وتحت أي ظروفء وذلك من 
أجل الإجابة عن بعض الأسئلة المحددة: بدلا من تشغيل البيانات من خلال مصنع "نقانق" 
إحصائ والذي ينتج لعوما صقفة الجيدة من الألقه إل الباء يدا من تقطيع اللحوم 
امنتقاة. 


وفيما يتجاوز الأملوب المنهجي والمعرفيء فإن جزءاً من القضية هو أنه يبدو أن بعض 
تحليلات البيانات الكبيرة تحدث دون وجود أي أسئلة على البالء أو أن يكون التركيز 
مدفوعاً من قبل تطبيق طريقة أو محتوى للجموعة البيانات بدلاً من سؤال محدد. أو أن 
تكون مجموعة البيانات مستخدمة من أجل البحث عن إجابات عن أسئلة م يتم تصميمها 
لكي يتم الإجابة عنها في المقام الأول. وفيما يتعلق بالأخيرء م يتم إنتاج بيانات تويتر ذات 
اللكان اللعود حقراقيا من أجل تقديم إجابات تتعلق بالتركيز الجغرافي لمجموعات اللغة في 
مدينة ما والعمليات التي تقود مثل هذا الارتباط الآلي المكاني. فنحن يجب علينا ألا نشعر 
بالدهشة رما في حالة ما إذا كانت النتيجة لقطات سطحية فحسبء حتى وإن كانت لقطة 
رائعة. بدلاً من ذلك فإن ما يجب أن يدهشنا هو الرؤى المتعمقة والمتغلغلة في جغرافيات 
الجنس. واللغة» والتكتلات, والانعزال في أماكن معينة. ولهذه الأسباب. ستظل دراسات 
البيانات الصغيرة مفيدة. 

وفي معرض الدفاع عن المنهج اللمستخدم من قبل العلوم الإنسانية الرقمية, ادعى 
(2011) طاعتىمصة31 أن الهدف ليس استبدال الخبراء البشريين بأجهزة الحاسبء ولكن 
الهدف هو استخدام التحليلات من أجل استكشاف مجموعات البيانات الهائلة مثل بلايين 
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التغريدات, أو ملايين الفيديوهات على موقع يوتيوب. أو عشرات الآلاف من الروايات ومن 
ثم اختيار أهداف تمثيلية معينة من أجل التحليل اليدوي المحكم. وبعبارة أخرىء فإن 
منهج العلوم الإنسانية الرقمية يفتح أمامنا إمكانية إجراء الدراسات السطحية على نطاق 
واسع عبر الأشخاص بدلا من الدراسات المتعمقة التي تركز على أعداد قليلة من الأفراد 
(2011 طعةمصة81). وبالمثلء يدعي البعض أن هذ المنهج يوفر العمل الدؤوب للتعمق 
في آلاف صفحات الأخبار ومشاهدة مئات الساعات من البرمجة. لكي "يتمكن الباحثين 
من تركيز طاقاتهم بشكل فعلي على التفسير" (2012 1121115). ولذاء اقترح اأء 112011225 
1 :2013) .31) أن: " أتمتة الكثير من المهام في تحليل المحتوى الإخباري لن يحل محل 
الحكم البشري المطلوب من أجل أشكال التحليل النوعية والدقيقة, ولكنه سوف يسمح 
للباحثين بتركيز اهتمامهم على مدى أبعد بكثير من أحجام عينة الأشكال التقليدية من 
تحليل المحتوى. وبدلاً من قضاء الكثير من العمل الثمين على مرحلة ترميز البيانات الخام,» 
يمكن للمحليين التركيز على تصميم التجارب والمقارنات من أجل اختبار فرضياتهم»: وأن 
يتركوا لأجهزة الحاسب مهمة اكتشاف جميع المقالات في موضوع معينء وقياس العديد من 
سمات المحتوى مثل قابليتهم للقراءة» واستخدام أشكال معينة من اللغة والمصادر إلخ. 
مجرد عدد قليل من اللهام التي يمكن أتمتتها في الوقت الراهن 

وبا مثلء فلقد ادعى (2012) نيععاوناء5 أن العلوم الإنسانية الرقمية لا 5 تسعى إلى "أن 
تستبدل الأدب برموز الحاسبء أو أن تقايض التعقيد الأدبي بصيغ لا هدف لها. دل من 
ذلك» فإن هذه المشروعات تفكر فحسب بطرق إبداعية عن المشاكل التاريخية الأدبية التي لا 
يمكن التعامل معها بسهولة بدون الحواسيب". وبالنسبة ل (2010 :2003) تإةوطة2: بمكن 
أن تساعد الحوسبة في عملية التفسيرء ولقد ادعى أن القراءة المتأنية تتضمن ممارسات اختيار 
وعزل وملاحظة الأماط في النصوصء وأن الترميز ذو كفاءة عالية في مثل هذه ا ممارسات. 
وعلاوة على ذلكء فإن الترميز يقوم بالأمر نفسه بطرق أكثر موضوعية واتساقاً من النظرة 
الذاتية للعامء وبدلا هخ اسعدال اصرف غان:اللعتى. قبالنيية له فإن فوظليف الخذا رزميات 
يسهل هذه العملية. 
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إن دفاع العلوم الاجتماعية الحاسوبية أمر مختلف تماماً في الغالب. ففي حين أن جميع 
العلوم الإنسانية الرقمية تقر بقيمة القراءة المتأنية» وتؤكد أن القراءة عن بعد تكملها 
من خلال توفير التعمق والسياقية, فإن الأساليب الموضوعية للعلوم الاجتماعية تتعارض 
مع المناهج بعد الوضعية. إن الفرق بين العلوم الاجتماعية الحاسوبية والعلوم الإنسانية 
الرقمية بهذا الصدد يرجع إلى أن الإحصائيات المستخدمة في العلوم الإنسانية الرقمية 
وصفية بشكل كبير تحدد الأنماط وتصوغهم كأعداد وصور وخرائط. وعلى النقيض من 
ذلكء فإن العلوم الاجتماعية الحاسوبية تستخدم المنهج العلمي حيث تكمل الإحصائيات 
الوصفية بالإحصائيات الاستدلالية التي تسعى إلى تحديد السببية. وبعبارة أخرى. فإنها 
تحصل على الدعم من قبل ا معرفة حيث يكون الهدف هو تقديم نماذج إحصائية متطورة 
تفسر وتحاقي وتتنبأ بالحياة البشرية. ومن الصعوبة بمكان التوفيق بين هذا وبين مناهج 
ما بعد الوضعية, فالدفاع في هذه الحالة يرتكز على فائدة وقيمة الطريقة والمناهج: وليس 
على توفير تحليل تكميلي لمجموعة من البيانات أكثر تمددا. 

وهناك بدائل مثل هذا الموقف. مثل البديل الذي تم تبنيه في نظم ا لمعلومات الجغرافية 
(615©) والإحصائيات الجذرية (5ع5686156 21ء1201): وهؤلاء الذين يستخدمون مناهج 
ذات طرق مختلطة. وهذا يتضمن إما توظيف النماذج والإحصائيات الاستدلالية شريطة 
أن يكون هنالك إدراك لمواطن الضعف فيهماء أو كما يحدث على نحو شائع. استخدام 
الإحصائيات الوصفية التي تدعمها دراسات البيانات الصغيرة. وهناء يتم استخدام كل من 
البيانات الكبيرة والبيانات الصغيرة من أجل توفير رؤى مختلفة ولكن تكميلية. وبغض 
النظر عن مثل هذه التكميلية: فإن الكثير من علماء ما بعد الوضعية سوف يستمرون في 
مقاومة البيانات الكبيرة والمناهج الإحصائية بأشكالها المتعددة, وبلا شك فإن المجادلات 
سوف تتسارع وتيرتها في المستقبل المنظور. 
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الخاتمة: 

هناك شكوك قليلة بأن ثورة البيانات أتاحت احتمالية إعادة التشكيل المعرفي للعلوم, 
والعلوم الاجتماعية والإنسانية» وأن مثل إعادة التشكيل هذه تحدث بالفعل بشكل فعال 
ونشط. فالبيانات الكبيرة وتوسع البيانات الصغيرة من خلال البنى التحتية للبيانات يساعدان 
على تنفيذ مناهج جديدة تجاه إنتاج وتحليل البيانات» مما يجعل من الممكن توجيه الأسئلة 
والإجابة عنها بطرق جديدة. وقد شجع هذا البعض على الادعاء بشكل جريء بأن ثورة 
البيانات هي ابتكار تدميري يعلن عن نقلة نوعية في كيفية إجراء البحوث. وهذه بالقطع 
هي الحالة حيث إن التحول من صحاري البيانات إلى طوفان البيانات وتحليلات البيانات 
الجديدة سيغير الممارسات البحثية. وعلى الرغم من ذلكء يتعين أخذ الحيطة عند القيام 
بتأكيدات تتعلق بإعادة تشكيل البحث وبأفضل طريق ممكن اتباعه في إعادة التشكيل هذه. 


إن العلم عامل بشكل سين من قبل الادعاءات القائلة بأن ثورة البيانات تعني "أن 
البيانات يمكنها أن تتحدث عن نفسها" أو أنه يمكنها بدون أي مشاكل استخدام أساليب 
مثل تجريف البيانات حيث يسبق الارتباط السببية, (انظر الفصل التاسع). وتعد المناهج 
التي يتم تطويرها داخل العلوم المقادة بالبيانات والتي تمزج بين الاستدلالء والاستنتاج 
والاستقراء أكثر إنتاجية بكثين حيث تتم إعادة تشكيل الطريقة العلميةء وذلك بدلا من 
تدميرهاء إن الأسس الفلسفية للعلم المقاد بالبيانات» على الرغم من ذلكء لا تزال في أطوارها 
التمهيدية وهناك حاجة للتفكير المستفيض في معتقداتها ا معرفية ومبادئها ومنهجيتها. 

أما الموقف فيما يتعلق بالعلوم الاجتماعية والعلوم الإنسانية فهو أكثر تعقيداً بشكل ما 
وذلك إذا وضعنا في الاعتبار تنوع الأسس الفلسفية لهذه العلوم. حيث إنه من غير ا محتمل 
أن تقود ثورة البيانات إلى تأسيس نموذج جديد. وبدلا من ذلكء فإن البنى التحتية للبيانات 
وثورة البيانات سوف يعززان مجموعة البيانات المتوافرة للتحليل ويمكنان مناهج وأساليب 
جديدة. ولكنها لن تحل محل دراسات البيانات الصغيرة. وفيما يتعلق بالعلوم, هناك 
حاجة لتفكير نقدي أوسع في الآثار المعرفية لثورة البيانات على العلوم الاجتماعية والعلوم 
الإنسانية. وهذه المهمة بدأ بالكاد التعامل معها وذلك على الرغم من سرعة التغيير الحاصل 
في مشهد البيانات. 
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الفصل التاسع 
القضايا الفنية والتنظيمية 


(15511©5 22610221 تصدع 02 لطهة لمعتصطءء 1 ) 


كما ناقشن في الفصلين السابقينء توفر البنى التحتية للبيانات ومبادرات البيانات 
المفتوحة وإنتاج البيانات الكبيرة فرصاً جديدة لقياس وفهم العالم. وهي أيضًا تثير قضايا 
فنية وتنظيميةء وتطرح أسئلة معيارية وأخلاقية. وفي هذا الفصلء سيتم التركيز على الأمر 
الأول بما يعني التركيز على بعض القضايا مثل مجال مجموعات البيانات, والوصول إلى 
البيانات. وجودة البيانات. وتكامل البيانات: والتبادلية (القابلية للتبادل)» وتطبيق التحليلات 
والمغالطات البيئية» والمهارات والقدرات والإمكانات التنظيمية. فبعض هذه القضايا يممكن 
التعامل معها من خلال الحلول الإدارية والفنية» في حين أن البعض الآخر من هذه القضايا 
تمثل مشاكل عسيرة الحل ومن الصعب التعامل معها. وعلى الرغم من ذلككء فإذا كانت 
القضايا المتعلقة بجودة البيانات والمغالطات البيئية لا يمكن التعامل معها بشكل كاف» 
ففي هذه الحالة لا يهم ماهية النظريات المعرفية التي يتم تطبيقهاء (انظر الفصل الثامن), 
لأن التحليلات والتفسيرات ستكون محل ارتياب. وعلاوة على ذلكء فإذا كان الوصول إلى 
البيانات مقيداً بشكل كبيرء أو إذا كانت الحكومات والشركات والمجتمع المدني يفتقرون 
المهارات الكافية لإدراك المغزى من هذه البيانات. ففي هذه الحالة ستكون قيمة ومنافع 
البيانات المفتوحة والكبيرة المتدرجة مقيدة بشكل كبير للغاية. ونتيجة لذلكء فإن القضايا 
التي تمت مناقشتها في هذا الفصل لا يمكن تجاهلها أو إبعادها بسهولة. ومن ثم فهي 
تتطلب الاهتمام البالغ. وفي الفصل التاليء سيتحول التركيز إلى قضايا سياسية واجتماعية 
أعم وأشمل والتي تتعلق بإنشاء ومشاركة وتحليل واستخدام البيانات مع الوضع في الاعتبار 
الأبعاد الأخلاقية, والقانونية» والأمنية لثورة البيانات. 
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الصحاري والفيضانات (5ء1385ء10 مه 5]زءوء10): 

في كافة النقاشات الدائرة بشأن ثورة البيانات يكون في الغالب من الصعب تحديد مصدر 
مجموعة مناسبة من البيانات فيما يتعلق بالكثير من الظواهر, وبخاصة تلك البيانات التي 
تغطي فترات زمنية طويلة ومتأصلة مكانياً. وبشكل جزي, فإن هذه تعد قضية من قضايا 
التغطية من ناحية» ومن قضايا الوصول من ناحية أخرىء فمن جانب التغطية فإن جميع 
مصادر البيانات محددة من ناحية العينة. وا مدى الجغرافي. والوقت. ومتغيرات الصفات 
(الحقول) والمؤشرات. وفي الواقع, فإن العام معقد بشكل كبير لغاية أنه يستحيل التقاط 
نطاق كامل وكافة فروقاته الدقيقة, وتناقضاته. وتبايناته. 


إن البيانات التي يتم جمعها من خلال دراسات البيانات الصغيرة تعد عينات بشكل 
صريح للغاية, وهي تجمع بشكل غير مستمر, وهي ذات رقم محدد من المتغيرات وذلك 
بالنظر إلى تركيزها المحكم والتكلفة المرتبطة بالجمع والتحليل. فمعظم هذه الدراسات 
تمثل دراسات أو تجارب منفصلة تركز على قضايا وحالات معينة لمجموعة. مؤسسة. أنواع,» 
أماكنء تقنيات... إلخ» وهي تفتقر إلى المكون الطولي حيث إنها لا تغطي فترات زمنية 
متعددة وطويلة. فالدراسات التي تقوم بدراسة التغييرات بمرور الوقت عادة ما يتم 
تكرارها على فترات محددة. وفي هذه الحالة» فإن فهمنا لظاهرة معينة عادة ما يعتمد 
على مجموعة مقيدة من البيانات. وحتى عندما يتم تجميع وترقية مجموعات البيانات 
داخل البنى التحتية للبيانات» فإن التغطية تكون جزئية وانتقائية. فعلى سبيل المثال فإن 
مجموعات بيانات الإدارة العامة الأيرلندية ذات تغطية محدودة وهي مملوءة بالفجوات 
والسكنات عن قطاعات معينة مثل قطاعات الإسكان والنقلء وغالباً ما يتم الاحتفاظ بها 
داخل المؤسسات (2007 .21 © صنطء ك]1). 

وعلى نحو مشابه» فإن البيانات الكبيرة رما تميل إلى أن تكون بيانات شاملة» ولكن وكما 
هو الحال مع مجموعات البيانات الأخرى: فإن كلتيهما تكون تمثيلاً وعينة. وهي تحل, 
بشكل جزني فحسبء قضية صحراء البيانات التي يقصد بها أن تكون البيانات موزعة على 
مجاميع بيانات متفرقة يصعب استقاء البيانات منها أو إضافة بيانات اليها. وكما لاحظنا في 
الفصل الثانيء فإن البيانات التي يتم التقاطها تتشكل من قبل التقنية ا مستخدمة: والسياق 
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الذي تم فيه إنشاء هذه البيانات» وتوصيف البيانات الذي تم توظيفه. فالبيانات المنشئة 
تمثل عادة ما يمكن التقاطه إلى حد ما بطريقة مباشرة. وهي تكون في غالب الأحيان منتجا 
فرعياً للنظام. ويكون مجالها الفوري مقيداً من قبل النطاق كسلاسل الأسواق المركزية, 
وشبكات المستشعرات. ومواقع التواصل الاجتماعي. وفيما يتعلق بالعلوم: فإن البيانات 
الكبيرة يتم إنشاؤها حاليا مما يتعلق بمجموعة منتقاة من الموضوعات فقطء وهي بعيدة 
كل البعد عن أن يتم إنتاجها عبر جميع النطاقات والبؤر العلمية. وعلاوة على ذلك. فإن 
القرار فيما يتعلق بإنشاء البيانات الكبيرة م يتشكل بعد ولكنه يتطور ويتركز من أجل توفير 
مجموعة من الرؤى» بحيث تشكل كل واحدة منها بعضا من العناصر التي يتم التقاطها 
كالاتساع, والعمق, والتفاصيل... إلخ. وحتى عندما يتم دمج بيانات كبيرة مع مجموعات 
البيانات الأخرىء فإن مجالهم كو عبدا كل السدعن كو مها عالماء نذا ان 
البيانات الكبيرة» في هذه الحالة: لا تعالج مسألة صحاري البيانات وذلك فيما يتعلق بالكثير 
من مجالات الدراسة. 

وق الوقت نفس وق حين أن ضخاري البيانات مازال تواجدها مستمراء فإن البتى 
التحتية للبيانات والبيانات الكبيرة أنشأا 'طوفاناً من البيانات في بعض المجالات. وكما لاحظنا 
في الفصل الرابع كان هناك عر ملحوظ في حجم وسرعة إنتاج البيانات والتي تم تحديدها 
من أجل أن تنمو بسرعة عالية. وذلك مع إنشاء وبدء المصادر الجديدة, وتعقد مجموعات 
البيانات التي تم إنتاجهاء والمقدرة على ربط البيانات بعضها البعض. ومن شأن هذا الطوفان 
أن يفرض عددا من التحديات فيما يتعلق بالمناولة» والمعالجة, والتأمين» والتصنيفء والفهم 
طثل هذه البيانات (2011 اعقضاع18 له ماصدى). فيزلا من مجموعات البيانات الصغيرة 
وغير المستمرة, يحاول المحللون الاستفادة من الكميات الهائلة من البيانات التي يتم تدفقها 

من أنبوب سميك. فمعظم هذه البيانات أصبحت بيانات عابرة وتم فقدهاء وم يتم أبداً 
تحليلها أو الاستفادة منها. وبعض هذه البيانات قد تم تخزينها في مستودعات البيانات 
التي تمثل إلى حد كبير مكبات غير مراقبة للنفايات (2013 7إةوة). وهناك يتم الإبقاء عليها 
حتى تأت أوقات يمكن لهذه البيانات أن تقدم فيها معلومات مفيدة. ونتيجة لذلكء وبينما 
تزداد نسبة البيانات بشكل تصاعديء فإن نسبة البيانات التي يتم معالجتها وتحليلها تقل 
بشكل كبير (2012 21 ]© 011105وم7110). وقد أشار (2012) 114 إلى أنه في الوقت التي 
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تزداد فيه البيانات» يتم الحصول على معلومات أقل كنسبة من هذه البيانات. وبعبارة 
أخرىء تزداد ضوضاء البيانات بشكل كبير للغاية ولكن إشارات المعلومات تنمو بشكل أقل 
بكثير. وعلاوة على ذلك: يصبح الأمر أكثر صعوبة لعزل هذه البيانات في خضم هذه الضواء 
(انظر 2012 :51196). وهذا بلا جدال وظيفة البيانات الكبيرة وعلم البيانات حيث لا 
يزالان في أطوارهما الأولية» ومع الاستغلال الكامل للأساليب الحديثة والتي بإمكانها مراقبة 
ومعالجة وتحليل كميات هائلة من البيانات بشكل آني أو لحظي إلا أن هذا من المتعذر 
تحقيقه بشكل كبير. وحتى مع نضوج وتطور تحليلات البيانات الكبيرة» فإنه من المرجح أن 
تعاني من أجل تطوير طرق ومناهج يمكن من خلالها استخلاص التحليلات المفصلة وليست 
التحليلات السطحية؛ والتعامل مع أسئلة "اذا" وكذلك أسئلة "ماذا"؛ وتقديم إيضاحات 
وليس شروحات (انظر الفصل الثامن). وعلاوة على ذلكء يتعين تنويع هذه الطرق وذلك 
من أجل مجاراة الأشكال الجديدة من البيانات التي يتم إنشاؤها من قبل ا مصادر المبتكرة. 
وحتى مع تحقيق ذلكء فإن مجاراة طوفان البيانات واستخلاص إشارات ذات مغزى من 
القوضاء سكون كناها من . 


الوصول (ووعءء»©4): 

إن العائق الأساسي الآخر أمام الاستعانة بمصادر مجموعات مناسبة للبيانات هو مدى 
قابلية الوصول إلى هذه المجموعات وقيود التراخيص التي تحدد معايير استخدام تلك 
ا مجموعات. وبشكل واضح. وكما ناقشنا في الفصلين الثاني والثالث,. فإن الوصول يعتبر 
قضية أساسية فيما يتعلق بالبحوث والبيانات الممولة من قبل المؤسسات العامة والتي 
تنشتها الجينات العامة. فمحفوظات البيانات والبنى التحتية للبيانات ومبادرات البيانات 
اللقتوحعة 5 تعني وتهتم بشكل كبير بمشاركة وإنتاج البيانات المتاحة للتحليل. وكما أوضحت 
ا مناقشات في القصول لقان إلبما سابقا: فعلى الرغم من حقيقة أن البيانات غير تنافسية, 
وغير قابلة للاستثناء أو الإقصاء. ولها تكلفة هامشية عند استنساخها (2010 810:101). إلا أن 
البيانات مقيدة بشكل شائع وذلك عند توزيعها. وفي بعض الأحيانء فإن الوصول المقيد إلى 
البياقاث ركون أمرا مرغوبا فيه وذلك إذا وضعنا في اعتبارنا طبيعتها الحساسية والشخصية 
وكذلك البعد الأخلاقي المرتبط بنشر واستخدام هذه البيانات (انظر الفصل العاشر). وفي 
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أحيان أخرىء يكون الوصول إلى البيانات مقيداً لأجل التأكد من أن هؤلاء الذين يحتفظون 
بهذه البيانات سيرفعون من قيمة هذه البيانات ويضيفون ميزات تنافسية لها أو يحققون 
أموالاً من خلال البيع او الترخيص للوصول لهذه البيانات (انظر الفصل السابع). وفي أحيان 
أخرىء ربما ترغب إحدى الهيئات في تقييد توزيع البيانات نتيجة أنها تخشى ما تمكن أن 
تكشفه هذه البيانات. والذي ربما يكون له تداعيات سياسية أو اقتصادية: أو يكون مرد 
ذلك الخوف من كشف تدني جودة البيانات التي كانت محفوظة. 

وفي حين أن هذه المعوقات بدأت تتلاثى ببطء فيما يتعلق بالبيانات ا ممولة وا مستحدثة 
من قبل ا مؤسسات العامة في الدول الدمقراطية الغربية» إلا أن مثل هذه التحركات تعد 
أكثر تقلباً مع تلك البيانات اللمستحدثة من قبل ا مؤؤسسات الخاصة. وفي الواقع, فإن هذا 
الأمر يعد متناقضاً إلى حد ماء إذ إنه على الرغم من طوفان البيانات الكبيرة الناشئ إلا 
أن الوصول إلى مثل هذه البيانات يظل مقيدا ةا في الوقت الحاليء وذلك بوجود 
عدد محدود للغاية من الكيانات الغارقة في مثل هذا الطوفان والتي يممكنها الوصول 
إليه (2011 عوصكآ ,2012 02:010:4). فالشركات من أمثال مشغلي الهواتف الخلوية, 
ومطوري التطبيقات, ومزودي وسائل التواصل الاجتماعي» وا مؤسسات اطالية. وسلاسل 
التجزئة» وشركات المراقبة والشركات الأمنية: لا يقع على كواهلها أي التزامات لمشاركة 
البيانات التي يستحدثونها من خلال عملياتهم التشغيلية بحرية. وعادة ما يتم التفاوض 
للوصول إلى البيانات بشكل فردي وهذا يتضمن توقيع العديد من اتفاقيات حماية ا ملكية 
الفكرية واتفاقيات عدم الإفصاح, وكذلك الموافقة على الشروط والبنود التي تحدد كيف 
وفي أي غرض سيتم استخدام أو لا يتم استخدام مثل هذه البيانات. وحتى بعد كل هذاء 
فمن المحتمل أن تمثل البيانات التي يتم توفيرها عينة محدودة, كما من الممكن أن تفتقر 
هذه البيانات إلى المعلومات السياقية مثل الكيفية التي تم تعيين هذه البيانات من خلالهاء 
أو تكون البيانات غير معالجة بشكل كبير أي لم يتم تنقيتها أو هيكلتهاء أو تكون ممُجمعة 
أو مُجردة من المتغيرات المفيدة: أو معالجة بشكل أو بآخرء وذلك من شأنه أن يُقيد 
أساليب تحليل هذه البيانات. وفي بعض الحالات. يمكن أن يتم إتاحة كمية محدودة من 
البيانات للباحثين والجمهور وذلك من خلال واجهات برمحجة التطبيقات (2مهعناممف 
5 - وعع112ء121 0115اتحطتهزع210). فواجهات برمجة التطبيقات تتكون من مجموعة 
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من الأوامر التي يمكن استخدامها من أجل استعادة البيانات المخزنة في قواعد بيانات على 
خادم متاح الوصول إليه للجمهور (2011 اء2132051). فعلى سبيل المثال. يسمح تويتر 
لعدد محدود من الشركات بالوصول إلى كافة بياناته المتدفقة عبر موقعه. وذلك مقابل 
رسوم أو لأغراض تجارية. وهو يتمتع بالصلاحيات التي تسمح له بإملاء شروطه فيما 
يتعلق بالأغراض التي يمكن فيها استخدام مثل هذه البيانات. فالباحثون يتم تقسيمهم 
إلى قسمين: القسم الأول يمكنه الوصول إلى *٠١‏ من التغريدات العامة» والقسم الثاني لا 
يمكنه الوصول إلا إلى :١‏ فحسب من التغريدات العامة» أو يمكنهم الوصول إلى مجموعات 
فرعية مختلفة من المحتوى (الحسابات المدرجة في القائمة البيضاء). وذلك مع استبعاد 
التغريدات الخاصة وال محمية في جميع الأحوال (2012 0:04 لصةه 4ز00). وفي 
حال المواقع الإلكترونية التي تحوي على سبيل امثال قوائم منتجات وتقييماتها (72:*0014 
15 لطنه دع طنا1.15) وأدلة أعمال (01165]ءع1011 ووع12ونا8): وكذلك في حال وسائل 
التواصل الاجتماعي والتي تتضمن اطلفات الشخصية العامة (5ع2:051 عنآان2) والتغذية 
(05عع1): فإن بعض الشركات مثل (012»ع.178.801685) (801685) وشركة ((2/02»202 
.01 توفر خدمات زاحف الشبكة (أي تصفح الشبكة العاطية بطريقة 
منهجية وآليه ومنظمة) وتجريف الشبكة (أي استخراج البيانات من مواقع الإنترانت عن 
طريق برامج مخصصة ) لحصد بيانات مفصلة من هذه المواقع أو للوصول لبيانات تغذية 


وما يقلق في هذا الأمر هو أن المعلومات التي يمكن أن توفرها البيانات الكبيرة ا مملوكة 
للشركات الخاصة والتي تم بيعها بشكل تجاري سوف تكون محصورة على قطاع الأعمال 
فحسبء أو ربما يتم إتاحتها المجموعة مميزة من الباحثين الأكاديميين الذين لا يمكن تكرار 
النتائج التي توصلوا إليها أو التحقق منها (2011 عوصذآ :2009 .21 © :226,آ). ولا أحد 
من هذه المواقف يخدم المصلحة العامة ولكن إذا وضعنا في اعتبارنا القيمة التجارية 
للبراقاك مل اللناققنة فإن زرادة الوضول إل ذه البباناظ لى يكوق ميمة سيلة أيذا. 
فحقيقة أن البيانات الكبيرة الثرية من الناحيتين الاجتماعية والثقافية مملوكة للشركات 
الخاصة تشير إلى أنه في الوقت الحالي لن يكون من السهل في الواقع إجراء بحوث العلوم 
الاجتماعية الحسابية والعلوم الإنسانية الرقمية (2011 <اء20:1ة381). فكما ذكر كلاً من 
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(673 :2012) 03571010 2ه 74زوط فإن " الكثير من الحماس الذي يحيط بالبيانات 
الكيرة ينبع من الإدراك القائل بأن هذه البياناث توقر وضولاً سهلاً لكميات هائلة من 
البيانات. ولكن من يتمتع بمثل هذه القدرة للوصول إلى هذه البيانات؟ ولأي غرض يتم 
الوصول؟ وفي أي سياق يجرى هذا الأمر؟ وما معوقات الوصول؟" فهذه أسئلة تتطلب 
الكثير من التفكير مع اتخاذ إجراءات مناسبة. 


جودة وصحة وأصل البيانات (ء112628 220 انع هته 17 ,012116 10262): 

جودة وصحة البيانات هما أمران مهمان للغاية كونهما يعززان المدى الذي يمكن أن يثق 
فيه المرء بالنتائج المستخلصة من تحليل البيانات. وترتبط جودة البيانات بمدى تنظيمها 
أي خلوها من الأخطاء والفراغات» ونقائها أي خلوها من التحيزء وتماسكها بمعنى أن تحوي 
القليل من التناقضات. بينما يُشير مصطلح صحة البيانات إلى موثوقية البيانات وإلى مدى 
تمثيلها للمعنى الذي تشير اليه بدقة (إتقان) وأمانة (إخلاص). ولهذا فإن تأسيس وتوثيق 
عوذة وضخة الياقاق يعر هقا رفسا في سَلالّة أصل البيانات. فسّلالة أصل البيانات هي: 


المعلومات التي تصف مصدر الملاحظات. والمنهجيات التي خضعت لها البيانات عند 
جمعها وتصنيفهاء والتعديلات» والتحولات, والتحليلء والاشتقاقات التي تعرضت لهاء وهي 
توفر أيضًا الافتراضات والمعايير التي تم تطبيقها عند أي مرحلة من مراحل حركة هذه 
البيانات, وكذلك أي تحيزات... وتوفر سَّلالَة أصل البيانات مجموعة بيانات مع أصلها 
وتسمح للمستخدم أن يحدد مدى ملاءمة البيانات للاستخدام (2012 1ه أكتتهط) . 

وهي أيضًا تصف بالتفصيل منشاً البيانات» ومن شأن الجودة والصحة وسّلالّة الأصل 
الضعيفة للبيانات أن يقوضنّ درجة الثقة والمصداقية التي يمكن أن يضعها الشخص في 
مجموعة البيانات والتحليلات التي اعتمدت على هذه البيانات. 

ومن الناحية التقليدية فإن الدراسات القائمة على بيانات نادرة والتي يكون حجم 
العينات فيها صغيراً في الغالب» فإن جودة وصحة وأصل البيانات تكون على قدر كبير 
من الأهمية. فإذا كان الشخص سيعمل على استخلاص نتائج عن السكان بالكامل وذلك 
اعتماداً على عينة مثالية صغيرة فإنه يتعين في هذه الحالة أن تكون العينة واضحة للغاية 
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وخالية من العيوب بأكبر قدر ممكنء ويتعين أن تكون على درجة عالية من الدقة والصحة. 
وعلى الرغم من ذلكء فإن عدد مجموعات البيانات يتم تشكيلها بشكل تام محدود للغاية, 
ويمكن استخدامها بدون أي شكل من أشكال تنظيف البيانات» بمعنى التحقق من الأخطاء 
وتصحيحهاء وإضافة البيانات المفقودة. ومعايرة وإعادة تهيئة البيانات حتى يمكن ربطها 
مع بيانات أخرى أو لتكون هذه البيانات سهلة الاستجابة لمناهج تحليل معينة (انظر 
الفصل السادس). ولذاء فإنه يتم استهلاك الكثير من العمل خلال تصميم البحث من 
أجل تقييد التحيزات المنهجية والتحيزات ال مرتبطة بتحديد العينات ي يتم التأكد من أن 
البيانات دقيقة وذات مصداقية بقدر الإمكان قبل تحليل أو مشاركة هذه البيانات. وتعمل 
المحفوظات الأرشيفية والبنى التحتية بشكل نشط من أجل التأكد من أن تظل مثل هذه 
البيانات ذات مصداقية ودقيقة وصحيحة مرور الوقتء مع المحافظة على سُلالَة أصل 
البيانات من خلال الاستقرار المؤسسيء وعمليات إدارة البيانات وواصفات البيانات» وتمكين 
نقل البيانات عبر مختلف الصيغات والمنصات بما يحقق المؤامة بين الأجيال المختلفة من 
التقنيات (2012 غ1:2111121116). وبدون مثل هذا العمل. فإن صحة البيانات المتضمنة داخل 
تلك البيانات سوف تتلاثى في القريب العاجل وذلك مع انعدام الثقة. 


وعلى النقيض من ذلكء ادعى البعض أن دراسات البيانات الكبيرة ليست بحاجة إلى 
تطبيق معايير جودة وصحة البيانات ذاتهاء وذلك يرجع إلى أن الطبيعة الكلية لمجموعات 
البيانات الكبيرة "ن- الجميع" (5-11 ) تجعلها تتخلص من التحيزات المتعلقة بتحديد 
العيناتء وتقوم بالتعويض, أكثر من ال مطلوبء عن أي أخطاء أو ثغرات أو تناقضات في 
البيانات أو أي ضعف في صحة البيانات (2013 تع كنات ممه عون طامط 1/]27:1-5). 
فالحجة التي استندت إليها وجهة النظر هذه أنه "مع وجود عدد قليل من الأخطاء المرتبطة 
بتحديد العينة» يمكننا تقبل أخطاء أكبر مرتبطة بالقياس" (ص 13)» "ويمكننا التسامح مع 
عدم الدقة" (ص 16). إن الثمن المقابل ل "ن- الجميع" (2-211) هو قبول الفوضى التي 
نشأت بشكل كبير من جراء صعوبة تنظيف البيانات ذات السرعة العالية وغير المنظمة, 
وتقبل البيانات كونها "محتملة أكثر من كونها دقيقة" (ص 35). وعند النظر إلى الأمر 
بهذه الطريقة. ادعى (2013 2ع014 امه عع نء طدمطء 3137:61-5) أنه " كلما كان هنالك 
بيانات أكثر. كان ذلك أفضل" أو للتعبير عن هذا الأمر بشكل آخرء "إذا كان لديك بيانات 
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كنرة هدا فإن ما هو سيد يذرحة كافية تعد حيدا بدرحة كافية" 182115420319 ومن 
ثم فقد ادعى (211 :2012) علصه:8 أن المطلوب هو "بيانات نظيفة بدرجة كافية", وهي 
البيانات التي تمكن المحللين من "الحصول على النتائج التي يمكنهم الوثوق بها". وبالطبع 
فإن هذا يفترض أن جميع استخدامات البيانات الكبيرة سوف تتسامح مع عدم الدقة: في 
حين أن الواقع يشير إلى أن الكثير من استخدامات البيانات الكبيرة تتطلب الدقة بشكل 
كبيرء أو على الأقل بيانات ذات معايير الأخطاء التي يمكن حسابها أي بيانات موثوقة. فعلى 
سبيل المثال» فإن موقع خريطة الطريق المفتوح (65516600135م0) يهدف إلى أن يكون 
في مستوى منتجات الخرائط الاحترافية من حيث التفصيل والدقة. ويهدف كذلك إلى كسب 
ققة هب عفد ون كوت مصدن فى مصاكو العرو فاك زهان الفضى قان تييف موسنوفة 
ويكيبيديا (41م18314) إلى أن تكون موسوعة دقيقة وموثوقة مثل الموسوعات الأخرى. 
وبطريقة مماثلة يتعين أن تكون البيانات المالية والبيانات الطبية دقيقة وصحيحة من أجل 
أن تغرس الثقة في نفوس التجار والأطباء والمرضى... والقائمة تطول. فمثل وجهة النظر هذه 
تفترض أيضًا أن سّلالة أصل البيانات وقضايا صحة وموكوقية البياقات لبست ميمة بالنسية 
مستخدمي البيانات. 


وبغض النظر عن تسامح بعض مجموعات بيانات البيانات الكبيرة تجاه عدم الدقة, إلا 
أن تحذير ال معطيات الرديئة تؤدي إلى مخرجات رديئة لا يزال ساريا. فمجموعات البيانات 
الكبيرة التي تنشئ بيانات معيبة ورديئة» وتم التلاعب بها ومتحيزة, أو تنشئ بيانات ذات 
مصداقية ضعيفة. سوف تؤدي إلى تحليلات ونتائج ذات مصداقية ضعيفة وسوف تكون 
الفوائد ا مرجوة منها قليلة للغاية بالنسبة لهؤلاء الذين يحللون ويستفيدون منها. ويمكن 
للبيانات الكبيرة. عن طريق طرق إنتاجهاء أن تعاني من جميع العللء فالبيانات يمكن أن 
تكون معيبة ورديئة من خلال أخطاء الأداةء حتى عبر التقنيات التي يفترض أن تكون ذات 
دقة عالية للغاية مثل نظام التموضع العالمي (6725) والذي تختلف دقته من جهاز لآخرء 
وعدد الأقمار الصناعية المتوافرة في وقت معين من الأوقات (2013 صنطءغك1 حصه عع00). 
أو من الممكن أن يكون قد تم التلاعب أو التزوير في البيانات من خلال حسابات مزورة أو 
القرصنة من أجل التأثير على الاتجاه العام وتوجيه العامة نحو مسارات محددة (2013 1715). 
فعلى سبيل المثال» هناك مثات الآلاف من الحسابات المزيفة على تويتر وهي تشكل .76 
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من إجمالي حسابات المستخدمين على تويتر (2013 مم50 لصة ناعطء2/1 26): وأيضًا فإن 
حتى 60“ من حسابات بعض العلامات التجارية متابعي تويتر هي حسابات آلية (تتهامعله0) 
22) وأكثر من درزنين من الخدمات تبيع حسابات تويتر مزيفة (2013 ددتوة8). 


فالبيانات يمكن أن تتسم بالتحيز جراء بعض الأسباب. إن الخصائص السكانية التي 
يتم اختيارها في العينات نادراً ما تكون شاملة وتتشوه إحصائياً من قبل الجنس. والنوع, 
والدخلء والموقع, والعديد من العوامل الاجتماعية والاقتصادية الأخرى. فليس جميع 
الأفخاص يستخدمون تويتر أو الفيسبوك أو يتسوقون من محلات معينة. أو يكونوا 
مشتركين في شبكة الاتصالات ذاتها... إلخ (2مغم دمن :2012 تسقطهةء» :2010 معنلامظ 
2 3 غ»). فالتقنية المستخدمة والمعايير المطبقة تؤثر على طبيعة البيانات. فعلى 
سيبل اتفال مكق أن يتاقر تحديد المشاركات الأكثرقراءة أو مشاركة على وسائل التواضل 
الاجتماعي بشكل كبير من خلال خوارزميات الترتيب وليس الاهتمامات البسيطة («متره8 
23. وعلى النحو ذاته. فإن واجهات برمجة التطبيقات تنظم ماهية البيانات التي يتم 
استخلاصهاء ففي تويترء على سبيل المثال» يتم التقاط الوسم المرتبط بالحدث وليس جميع 
التغريدات ذات الصلة (2013 وصتننا8), وأيضًا فقد بين (1[ه اأء مهلتهد8 - 0222165 
2) أن اختلاف طرق الوصول إلى بيانات تويتر - البحث في واجهات برمجة التطبيقات 
مقابل تدفق واجهات برمجة التطبيقات - يؤدي إلى الحصول على مجموعات مختلفة من 
النتائج. ونتيجة لذلكء لا توجد أي ضمانات بأن فريقين من الباحثين» على سبيل المثال» 
الذين يحاولون جمع البيانات ذاتها في الوقت ذاته سوف يكونون قادرين في نهاية المطاف 
على الحصول على مجموعات البيانات ذاتها (2013 ومعنا8). وعلاوة على ذلكء فإن اختيار 
البيانات الوصفية والمتغيرات التي يتم توليدها والبيانات الوصفية وامتغيرات التي يتم 
تجاهلها يؤدي إلى رسم صورة معينة. ومثل هذه التحيزات تؤدي إلى انحراف أو حتى إلى 
نشوء أفكار واتجاهات وأشخاص ونماذج مستترة لمم يتم تصويرها أو تمثيلها في مجموعة 
البيانات (2012 تمتقطهك). 

وفيها يتعلق بمصداقية البيانات. فإن الحال لا يتمثل دوماً في أن البيانات تعبر بصدق 
عما تم استخدام البيانات من أجل قياسه. فعلى سبيل المثال» هناك علامات استفهام 
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حول مدى حقيقة ودقة تعبير ا لمشاركات في وسائل التواصل الاجتماعي عن وجهات نظر 
الأفخاص. وعلى مدى الوثوق في مثل هذه المشاركات. وقد حذر (2011:6) طءع2/]22051 
قائلاً إن "المشاركات. والتغريدات, والصور التي تم تحميلهاء والتعليقات, وجميع الأشكال 
المختلفة من المشاركات على الإنترنت لا تعتبر نوافذ شفافة بذاتهاء مودلا من ذلك. فهي غالباً 
مرتبة بعناية وتتم إدارتها بشكل منتظم وذلك من خلال الانتقادات نفسها التي تنطبق على 
بيانات المقابلات ومجموعات التركيز" (م011© 5د5806). وأبدى آخرون شكوكهم حيال 
صحة بيانات علم ال مواطنة (عء»دعك5 2ء62زن) والتعهيد الجماعيء. وحذروا من جهل 
وعدم مقدرة الحشود على التنبؤ ومخاطر التفاوت (فيما يتعلق بالتغطية)» والمتغيرات 
(فيما يتعلق بالجودة والتجانس»» وتوليد البيانات المتحيزة المتأصلة في مشروعات المساواة 
الكبرىء التي تفتقر إلى القادة وتتشكل من مجموعة ضيقة من السكان ذوي التباين في 
المهارات والدوافع (2007 :,ه0). وفي الواقع, فإن وسائل التواصل الاجتماعي يهيمن عليها 
نخب رقمية غير ممثلة (2009 20016 مطة تعطءدامرن) في حين أن هناك مجموعات كبيرة 
من المجتمع مثل الفقراء وكبار السن لا ينخرطون في وسائل التواصل الاجتماعي أو يفتقرون 
إلى الهواتف الذكية. ومن ثم فإن أي بيانات يتم جمعها لا تعكس بالضرورة وجهات نظر 
هؤلاء الأشخاص أو أحيائهم (2013 018:1014). ومن ثم فمن الضروري للغاية أن يتم 
تحديد ووضع مثل هذه التحيزات في الاعتبار وذلك عند تحليل البيانات من أجل كسب 
فهم أكثر شمولية للظاهرة, وخصوصاً إذا ما كان سيتم استخدام مثل هذه البيانات في أعمال 
السياسة العامة والقرارات التي تؤثر على حياة الناس كالنتائج الصحية. 

وعلاوة على ذلك يوجد بعض المخاوف بشأن جودة وتجانس المحتوى والبيانات الوصفية 
التي تم تكوينها عبر أفراد متنوعي المهارات والدوافع» ومخاوف بشأن كيفية توفير درجات 
موثقة من الاعتمادية وتكوين إحساس بالمصداقية (2013 صنطءغة؟1 20ح ءعع1000). وقد 
أدى هذا بالبعض إلى افتراض أن عمل التعهيد الجماعي "الهواة" سيكون إجراؤه بشكل 
أفضل إذا يذل على تصحيح وتنويع البيانات وليس على تكوين البيانات (2007 :02 ). 
فالمثال الذي ألقى :0215 الضوء عليه هو موسوعة ويكبيدياء إذ على الرغم من كونها 
شهيرة وشاملة. إلا أنها تتوسع بشكل غير مدروس يماثل الاهتمامات المختارة للمشاركين» 
ويوجد بها مقالات غير كاملة وأحياناً مكتوبة بلغة ركيكة وتافهة ومطعون في صحتها بشكل 
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كبيرء مما يقوض حجيتها وإمكانية استخدامها أو نفعها. وادعى +031 أنه " إذا كانت 
موسوعة ويكبيديا غير مجانيةء فمن غير المحتمل أن قراءها سيكونون أكثر تسامحاً تجاه 
تلك العيوب." (2007:4). ويممكن أن تعاني خريطة الطريق المفتوح («ه]/لاءءع5مءم0) 
سوءً التغطية في بعض الأماكن حيث يوجد عدد قليل من المتطوعين. ويوجد أيضًا بعض 
المخاوف بشأن استدامة أعمال التعهيد الجماعي التطوعية. حيث ادعى 2007 :021 أن 
الارتباطات التي تربط مجموعة افتراضية من الناس سوياً عادةٌ ما تكون ارتباطات سطحية, 
وهي تفتقر إلى العمق والالتزام الإجباريء وعادة ما تكون عرضة للتشتتء. وهي تعتمد 
بشكل كبير على مجموعة أساسية صغيرة لكي تحافظ على سير المشروع وتوفر الجزء الأكبر 
من العمل. وعلى النقيض من ذلك. لاحظ البعض أنه فيما يتعلق ب ه/1اء2566»م0, 
فإن جودة البيانات المقدمة تطابق جودة البيانات التي تقدمها الشركات الاحترافية وأن 
التغطية متنوعة (2011 21 غ2 تإع<1100 ,2010 تروداكعلدآ]). 


فهذه ال مناقشة تلقي الضوء على أن كون مجموعة البيانات كبيرة للغاية من ناحية 
الحجم, فإن هذا لا يعني بالضرورة أنها عشوائية أو ممثلة للضاهرة أو صحيحة أو ذات 
مصداقية أو موثوقة. وكما لاحظ (2012) 0235040104 3204 4ز60: "كون البيانات الكبيرة 
تزودنا بكميات هائلة من البيانات, فإن هذا لا يعني أن القضايا ا منهجية مم تعد ذات 
صلة. ففهم العينة على سبيل المثال» يعد أكثر أهمية الآن عما كان عليه الأمر في الماضي" 
(ص 668). وبالنسبة ل (615 :2009) .21 غ» عدن[اء>1 فإن هذه القضية تعتبر قضية أصل 
ومَنْشَأ أي "المعلومات المتعلقة بأصل وتعريف وملكية وبنية" مجموعة البيانات التي تمكن 
محللي هذه البيانات من معرفة كيفية تكوين هذه البيانات ومعالجتهاء وتمكنهم كذلك 
من تقييم جودة وصحة البيانات. وعلى الرغم من ذلكء فإن مصدر معظم مجموعات 
بيانات البيانات الكبيرة مقيد بهؤلاء الذين قاموا بإنشاء البيانات. مما يجعل من الصعوبة 
بمكان تقييم صحة الدراسات ال منشورة التي اعتمدت على هذه البيانات. فأحد التحديات 
الرئيسية التي تواجه البيانات الكبيرة يتمثل في المقدرة على معرفة تفاصيل سلالة الأصل 
والذي يشمل تقييمات مستويات الأخطاء والشكوك في مجموعة البيانات. وإنشاء وسائل 
فعالة للتحقق من وتنظيف ومعايرة البيانات عالية السرعة وشديدة التنوع. 
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دمج وتوافقية البيانات (7خلتطهضءم10ع ص1 ته دمتغهموء غ1 12دم1): 

إن أحد الوعود التي انبثقت عن ثورة البيانات هو إنشاء مجموعات بيانات ذات ترابط 
قوي مما يمكن هذه المجموعات من أن تتحد سوياً من أجل إنشاء قيم ومعارف إضافية. 

وكما اتضح من خلال تطور البنى التحتية للبيانات ومدمجي البيانات» فإن العديد من 
الاكاظ خرغة لي تندمج مع بعضها واتضح أيضًا أن الكثير من البيانات تظل منعزلة 
في مستودعات أو يمكن دمجها فقط من خلال معالجة إضافية كبيرة. ومن أجل أن يتم 
دمج البيانات في مجموعات بيانات جديدة: أو استخدام هذه البيانات بالاشتراك مع أي 
بيانات أخرىء فإن هذه البيانات تتطلب حقول تأشيريه مشتركة وتوفر معايير البيانات» 
وبيانات وصفية متسقة, وتوافق على مستوى التنظيم والصيغة. وفي حين أن تقدماً كبيراً 
قد حدث في إدارة البيانات وتطبيق معايير البيانات التي قادتها منظمات مثل المنظمة 
الدولية للمعايير (150) ورابطة الشبكة العابمية (18730) واتحاد المعلومات المكانية 
ال مفتوحة (©066) في سبيل المحاذاة بين البيانات والبيانات الوصفية وتحسين التوافق بين 
ا لمنصات التقنية المختلفة التي تعالج البيانات وتحتفظ بهاء وتطوير البيانات المترابطة, 
إلا أن الكثير من مجموعات البيانات لا يمكن ربط بعضها ببعض. فهي تشكل ما أطلق 
عليه (2012) 18د مصطلح "البيانات الجانحة" (1022 0ع صدهاد). 

إن معظم دراسات البيانات الصغيرة لا تزال تنشئ بيانات جانحة كونها تستخدم لغات 
توصيف خاصة بها وأنظمة تنظيم البيانات التي تناسب الأغراض التي سيستخدمونها فيهاء 
ولكن القليل من هذه الدراسات تضع في اعتبارها قضايا التوسع والربط. وهذه هي أيضًا 
الحال غالبا داخل المنظمات التي يوجد بها إدارات منفصلة تستخدم أنظمتها الإدارية 
والتصنيفية الخاصة. فعلى سبيل المثال» فإن كل واحدة من هيئات التخطيط التي يبلغ 
عددها ثمان وتمانين هيئة في إيرلندا تستخدم نظامها الخاص لاستخدام الأراضي وتصنيف 
امناطقء وعلاوة على ذلك. فهذه الهيئتات توظف العديد من ال منصات التقنية المختلفة 
لغرض إدارة وتخزين وتخطيط البيانات. فربط جميع هذه البيانات وتوحيدها في نظام 
وطني واحد ليس مهمة سهلة على الإطلاق. وبالمثلء فإن توسيع مجموعات البيانات 
الوطنية سوف يواجه مشاكل مماثلة. فعلى سبيل المثال. فإن ربط الإحصائيات السكانية 
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ف إيرلندا وإيرلندا الشمالية سوياً من أجل إنشاء مجموعة بيانات واحدة للجزيرة بالكامل 
يفرض عدداً من التحديات الفنية وذلك يرجع إلى أن ١‏ من الأمئلة متطابقة, و0؛: 
أخرى من الأسئلة يمكن أن يتم مضاهاتها وذلك من خلال تقسيم خطط التصنيف وإعادة 
تجميعها في الخطط المشتركة. وحتى إذا تم هذاء فإن البيانات ستكون ذات جغرافيات 
إحصائية ضمنية مختلفة يتم تجميعها في وحدات مختلفة الأحجام (2007 21 اء صنطء]2]). 

وتتضاعف هذه القضايا عبر قارة أوروباء حيث تتبع كل دولة وكل مؤسسة إجراءات 
مختلفة (وحدات وتصنيفات). وتعتمد فترات زمنية متفاوتة (عدد المرات التي يتم فيها إنشاء 
البيانات). وتستند إلى أماكن متباعدة (الجغرافيا الإحصائية). وتستعمل تقنيات مختلفة 
(الصيغ). ومن ثم فلقد استنتج (118 :2012) 1616 أنه حتى مع وجود بيانات حكومية 
شاملة. إلا أنها في غالب الأحيان تتصارع تحت وطأة الأعداد التي لا تحصى من مجموعات 
البيانات المتضاربة وغير المتوافقة وغير الصالحة للمقارنة. وتسعى بعض اللمبادرات مثل 
توجيهات إنسبير (12152111) (البنية التحتية للمعلومات امكانية في المجتمع الأوروبي) 
إلى تكوين بيانات مشتركة عبر الجغرافيا الأوروبية الإحصائية المشتركة. ولكن الوصول إلى 
توافق في هذا الشأن يُعتبر عملية بطيئة وذلك يرجع إلى أن جميع الولايات لا ترغب 
في الانتتقال بشكل أحادي (أي من طرف واحد) إلى نظام جديد للبيانات وخلال العملية 
يوقفون سجلاتهم الزمنية ويفقدون مقدرتهم على إجراء تحليلات زمنية متتالية. إضافة 
إلى أن كل ولاية لها أولويات مختلفة فيما يتعلق بالبيانات التي ترغب في إنشائها وتتبعها. 

وتوجد هذه التحديات نفسها فيما يتعلق بالبيانات الكبيرة. والتي ربما تكون غير 
متجانسة وغير منظمة بشكل كبير للغاية» ومتفاوتة فيما يتعلق بالجودة وهي أيضًا مرنة 
وقابلة للتوسع. فربط وتجميع مثل هذه البيانات ليس مهمة سهلة على الإطلاق وهي 
تتطلب تطوير مجموعة جديدة من الأدوات والأساليبء وكذلك إنشاء وتبني معايير جديدة 
للبيانات. فأحد الحلول ا مطروحة. والذي أشار إليه (2011) 41 :© 5016 هو دمج البيانات 
المخصص والذي يمكن ال مستخدمين من التحكم بسرعة وبشكل مباشر في أي من البيانات 
التي سيتم دمجهاء وذلك على الرغم من أن هذا يتطلب أن تكون مجموعة الّبيانات تتمتع 
بسمات معينة مثل البنية التحتية الدلالية المؤثرة. إن ربط وتجميع مثل هذه البيانات 
من الممكن أن يؤدي إلى التلوث المتقاطع (2126102:هغ02055-00)) بسبب البيانات 
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ذات الجودة الضعيفة والحالة المتهالكة مما يؤدي إلى فساد وتلويث مجموعات البيانات 
الفعالة ويحولها إلى مجموعات بيانات ضعيفة. ومع ازدياد طوفان البيانات. فإن إيجاد 
الحلول التي تساعد على دمج البيانات وتوحيدها وتحافظ على سلامتها وفعاليتها سيمثل 
قضية ملحة. وذلك على الرغم من أن عدم المقدرة على ربط البيانات له جوانب إيجابية 
أيضًا وذلك فيما يتعلق بتقييد مراقبة البيانات وتحسين أمن البيانات (انظر الفصل العاشر). 


التحليل الركيك وا مغالطات البيئية (5وع12112 [دءذأع10م0ع58 220 5زوترلدسة :هه5): 


جميع النتائج التي يتم التوصل إليها من الدراسات تكون دقيقة وسليمة وقوية بحسب 
البيانات التي تم استخدامها والتحليلات التي أجريّتء وإذا ما وضعنا جودة وصحة البيانات 
جانباء فخلال تصميم أي بحث يكون من المهم للغاية استخدام منهجية ملائمة وآليات 
مناسبة. فالإخفاق في فعل ذلك سيؤدي إلى مغالطات بيئية خطيرة عند تفسير النتائج» 
بمعنى استخلاص النتائج المضللة والتي في الواقع لا تدعمها البيانات المستخدمة. وهناك 
تاريخ طويل من ال مساجلات التي تتعلق بمكامن القوة والضعف النسبية في العديد من 
الأأنماط والأساليب المنهجية المختلفة» والظروف التي يمكن فيها تطبيق مثل هذه الأنماط 
والأساليب بشكل صحيح. وعلى وجه العموم: هناك الآن إرشادات وقواعد محددة بشكل 
واضح تتعلق بكيفية تكوين وتحليل أنواع مختلفة من البيانات عبر أنظمة متعددة. وعلى 
الرغم من ذلكء وفيما يتعلق بالبيانات الكبيرةء فإن علوم البيانات لا تزال في أطوارها 
التمهيدية. ومثل هذه المعايير لا تزال في طور التشكيل والصياغة, فآليات جديدة يتم الآن 
اختراعها.ء وتوسيعهاء وتقييمها. 

وهناك أربع قضايا منهجية تتعلق بالبيانات الكبيرة جذبت الانتباه. فأولى هذه القضايا 
تتمثل في الإجابات المتفاوتة بشكل عميق والتي تؤدي إليها الافتراضات والمقاربات داخل 
النماذج (2012 511066). وثاني مدى قدرة الآليات والأساليب المستخدمة على إحداث 
الاستسقاطء أي رؤية واستخلاص أنماط من البيانات العشوائية التي لا معنى لهاء أو إحداث 
فرط التعلم أو الملاءمة (076156]128) والتي تحدث عندما يصف نموذج إحصائي خطأ 
عشوائيًا أو ضجيجًا بدلا من العلاقة الكامنة (2012 0123501014 لصه 4:ز50). أو الخطأ 
في التعامل مع التشويش على أنه معلومات (2013 516861 :2012 ع5117). وثالث هذه 
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القضايا يتمشل في الاتهامات بأن بعض الآليات ا معينة تؤدي إلى ما هو أكثر بقليل من 
تجريف البيانات (2011 ناع]وداء11) (128ع0ء10 12262). وأغزراء إذا كان بإمكان الآليات 
أن تتوسع خارج نطاق بيانات ضبط الاختبار إلى مليارات السجلات المتدفقة في العام 
الواقعي (2008 مله اأء غصهت8). 


إن النماذج تهدف إلى توضيح والتعبير عن العلاقة بين المتغيرات وكيفية عمل النظام. 
فكل نموذج يتم تأسيسه على نظرية معينة» وبناؤه باستخدام مجموعة من الافتراضات 
والمقاربات التي تبين كيفية تفاعل المتغيرات» في حين أنه يتم اختبار صحة النموذج من 
خلال البحوث التجريبية» فإذا كانت النظرية والافتراضات غير صحيحة. فإن جميع التنبؤات 
ستكون غير صحيحة في هذه الحالة كذلك: وحتى التغييرات الصغيرة للغاية على الافتراضات 
في نموذج بمكن ما أن تؤدي إلى نتائج مختلفة تماماً. ففي حالة الأزمة المالية العالمية التي 
حدثت في العام 2008, ادعى (2012 511768) أن أحد العوامل المهمة للغاية في إحداث 
مثل هذه الأزمة كان استخدام نماذج تمويل دمجت ا مخاطر بحيث يمكن حساب احتمالية 
الدخل المحتمل مع الارتياب لأن المخاطر المحتملة من الصعب تقييمها. ونتيجة لذلك» 
اعتمدت النماذج على افتراضات غير يقينية ولكن تم معاملتها كما لو كانت مخاطر معروفة 
على وجه اليقين. والنتيجة كانت افتراض أن السندات المالية الجديدة التي يحيط بها 
ارتياب نظامي عال للغاية هي أصول ذات مخاطر منخفضة: وهذا افتراض ثبت أنه خاطئ. 
وف الأنظمة المعقدة فإن مثل هذه الأغطاء لايتم قياسها على أساس ذرجات ولكن يتم 
فياسها على أساس ترتيبها حسب الأهمية. وقد قدرت مؤسسات ستاندرد أند بورز وموديز 
(21000775 20 58:2) مخاطر التخلف عن الدفع والمرتبطة بالتزامات الديون ال مضمونة 
(009) بأقل من قيمتها بعامل من مائتين (45 :2012 5117612). وبغض النظر عن جودة 
البيانات الضمنية: فإذا كان النموذج خاطنًاء فأي نتائج يتم استخلاصها من هذا النموذج 
ستكون خاطتئة كذلك. 

لقد افترض (2013) 151" لصه (2013) عاللتكصة»» أن لعنة أو مأساة البيانات الكبيرة 
مضاعفة. نتيجة العلاقات الإيجابية الخاطئة بين البيانات؛ وأنماط مجموعات البيانات التي 
تكون عرضية بشكل تام, وليس لها أي قوى تنبؤية:» ولا يمكن تكرارهاء وربما يمكن أن 
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تكون قناعاً لنماذج أضعف ذات أهمية. فمجموعات البيانات تشتمل غالباً على البيانات 
التي يبدو أنها مرتبطة بعضها البعضء حتى ولو كانت العلاقة بينها عشوائية في الواقع. 
ومع زيادة حجم مجموعة البيانات, تتضاعف الأخطاء الإيجابية» إلى الحد الذي تكون فيه 
أي علاقة تقريبا بين البيانات مهمة من الناحية الإحصائية وفق معايير اختبارات الارتباط 
التقليدية (2013 <ع121' :2012 .21 أء تمحصدعه زد1 :2012 لسصداغدءط). وعلى النحو ذاته, 
ففي أساليب التنقيب عن البيانات» مثل شجرة القرارات (تسلسل اتخاذ القرار)» ممكن أن 
يتسم النموذج بفرط الملاءمة كي يتم استنباط نتائج استثنائية تحول إلى نتائج قابلة للتعميم 
مما يؤدي هذا إلى حدوث مغالطات بيئية. فالبيانات الكبيرة في هذه الحالة لا تعني معرفة 
أفضلء ولكنها تعني بالأحرى ارتباكاً أكثر وذلك من جراء صعوبة تحديد دالة حقيقية وسط 
ركام من الدلالات. ولذا فإنه: " أحياناً يكون الأقل هو الأقوى تأثير" (0ولنادط76؟ تم الاقتباس 
من 2012:14 تعنلاه8). 


إن أحد الجوانب المهمة في مشكلة الأخطاء الإيجابية ليس حجم مجموعة البيانات 
فحسب. بل كيفية معالجة وتحليل مجموعة البيانات هذه. فأحد أجزاء إستراتيجية الكثير 
من تحليلات البيانات الكبيرة يتمثل في فحص مجموعة البيانات قبل صياغة الافتراضات 
(انظر الفصل السادس». ومن الطرق المتبعة للقيام بهذا الأمر حساب الارتباطات بين 
جميع المتغيرات وذلك من أجل تحديد العلاقات المحتملة بين البيانات الجديرة بالدراسة 
الإضافية. وتشكل هذه العملية ما يعرف بتجريف البيانات (8«ذع1<:»0 122:2) والتي 
تسمى أحياناً تصيد البيانات. وهي ممارسة لا يحبذها بشدة الكثير من الخبراء الإحصائيين 
(2012 متتذصهط17-5واء212 :2011 1ءؤأوطء11). فالمشكلة التي ترتبط بهذا المنحى 
مشكلة مزدوجة. فمن جهة. هي تحدد آلاف الأخطاء الإيجابية المحتملة وذلك دون 
تحديد أيّ من هذه الأخطاء عشوائي وأيّ منها ذو مغزى. ومن جهة أخرىء يمكن أن تؤدي 
إلى التنقل من متجر لآخر طلبا للأرخص وعرض النتائج التي تؤكد اعتقاد المحلل مع وجود 
دليل من التحليل ا مستخدم من أجل أن يجعل الادعاء يبدو معلا روني (اعأوماع117 
3 طاهة151 :2011). فالسوؤال الشائك الذي يطرح نفسه هناء كما أشار (عالتكمه0 
73 هو كيف ممكن التمييز بين دالة حقيقية ودالة عرضية وسط الكميات الهائلة من 
البيانات؟ وكيف يممكن ألا ينقاد المرء للاستسقاط وفرط التعلم؟ 
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إن هناك بعض الحلول الممكنة. حيث اقترح (2015) .21 ا مهصهمةزه8 استخدام 
مبدأ بونفيروني (ند0ء14م80): والذي يسعى إلى تحديد الأحداث النادرة جد[ لدرجة أنها 
لا يمكن أن تحدث في البيانات العشوائية. وذلك من أجل فرز الارتباطات الفعلية عن 
الارتباطات العشوائية. كما كان (2013) ع151:آ من أنصار استخدام مستويات معيارية 
معززة. وذكر نقطة انطلاق معيار خمسة سيجما (22ع51 18176) المستخدم حالياً في الفيزياء 
من أجل مواجهة الارتباطات الوهمية وإعلان الاكتشافات (احتمال كون النتائج خاطئة 
وناتجة عن التغيرات الإحصائية فقط هو واحد في كل ثلاثة ملايين وخمسمئة ألف أو 


بيانات أخرىء أو التقسيم العشوائي لمجموعة البيانات الحالية إلى عينات ومعرفة إذا ما 
كانت العلاقة أو الارتباط سيظل وو عبر العينات (2000 2ء5مع][). وفيما يتعلق 
بفرط التعلم» ناقش (2010) 2411165 إستراتيجية استخدام الخلفية المعرفية» والتي تتكون 
من استخدام الحقائق ا معروفة عن مجموعة بيانات ممُستقاة من الافتراضات عن النظام,» 
والحقائق الملاحظة. ومعرفة الخبير أو النظرية:. أو المقاييس ا ممتعة وال مرغوب فيها التي 
تقيم البساطة والتيقن والفائدة والحداثة للأنماط المستحدثة, وذلك من أجل فصل الأنماط 
الهادفة عن التشويش. وعلى الرغم من ذلك فمن الواضح أن هناك حاجة لبذل أعمال 
إضافية من أجل تطوير أساليب لتقييم المغزى والدلالة في عصر البيانات الكبيرة. 

وإذا وضعنا في الاعتبار أن تحليلات البيانات لا تزال في مراحلها الأولى من التطور, وتم 
تطبيقها بالدرجة الأولى على بيانات الضبط والاختبارء يظل أيضًا هناك بعض المخاوف 
بشأن فعالية مثل هذه الأساليب في مجاراة البيانات الفوضوية وغير ا منضبطة. وكما أشار 
(4 :2008) .21 » غمنوحزظ فإن "الكثير من الخوارزميات لا تتوسع خارج نطاق مجموعات 
البيانات التي تتكون من بضعة ملايين من العناصرء أو لا يمكنها أن تتحمل التشويش 
والثغرات الإحصائية الموجودة في بيانات العام الواقعي". فإذا كان هناك أي اختلالات أو 
تحيزات موجودة في الخوارزميات. فمن شأنها أن تؤدي إلى انحراف النتائج وتفسيرات هذه 
النتائج (2012 0135710154 320 677060). ويرتبط بهذا التخوف أيضًا القلق من أن هناك 
اعتماداً مفرطاً والكثير جداً من الموثوقية الموضوعة في الخوارزميات وذلك من أجل إجراء 
التحليلات. واستخراج المنافع والمزايا التي تجلبها الخبرات والمعارف والفطرة البشرية من 


إلا ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة, والبنى التحتية للبيانات» والنتائج المترتبة عنها 


القضايا الفنية والتنظيمية 


أجل فهم ظاهرة ما (2012 #طه.آ). ومن ثم: هناك حاجة لإجراء المزيد من العمل من 
أجل تأسيس وتقييم صحة التحليلات الجديدة والثقة في النتائج التي يمكن استخلاصها من 
هذه التحليلات. 


ومن الانتقادات الأخرى الموجهة إلى تحليلات البيانات الكبيرة هو تركيز هذه البيانات 
على الآنية (هنا والآن). وذلك بالنظر إلى حداثتهاء وعلى وجه العموم: فإن البيانات الكبيرة 
تفتقر إلى العمق التاريخي. فشبكات الاستشعار الجديدة أو بيانات التعهيد الجماعي يمكن 
أن توفر بيانات مستمرة وثرية» ولكنها تتسم بقصر الفترات الزمنية التي تغطيها. ونتيجة 
لذلك. فإن الكثير من التحليلات تكون مناسبة في وقتها ولكنها تفتقر إلى العمق الزمني. 
وهذا أمر لا غبار عليه ومستحسن إذا كان الشخص مهتماً بالوقت الحاضر بتتبع حدث 
ممتد باستخدام وسائل التواصل الاجتماعي (على سبيل المثال حدث سياسي كبير مثل الربيع 
العربي)» أو أن يكون الشخص قا بتحليل عملية مادية لا تتغير بمرور الوقت (مثل تجربة 
فيزيائية). ولكن سيكون الأمر مسبباً للمشاكل إذا تم استخدامه من أجل فهم العمليات 
التي تمتد لآلاف السنين أو أكثر (على سبيل المثال الأنظمة البيئية والجيولوجية). وينطبق 
هذا الانتقاد أيضًاء بالطبعء على دراسات البيانات الصغيرة» والتي تعتبر أيضًا لقطات تم 
اتخاذها في أماكن معينة وأوقات محددة. 


المهارات والموارد البشرية (85 116501312 تتمسصحدنط1 سه كللك[د): 

في حين أن بعض تحليلات البيانات يتم تركها للخوارزميات» وخاصة العمل المتعمق 
للمعالجة والحسابات. إلا أن أعمال التوجيه والتفسير لا تزال إلى حد كبير حكراً على المحليين 
البشر. فبالاعتماد على مهاراتهم وخبراتهم ومعارفهم: يتخذ الباحثون والمحللون القرارات 
المتعلقة بالأماكن المثلى التي ينبغي التركيز عليهاء وكيفية صياغة وإجراء التحاليل» وإدراك 
امراد من النتائج والعمل على هذه النتائج. فالبشر يظلون هم الفاعلين الأساسيين في تأسيس 
وتشغيل والمحافظة على المشروعات التي تقودها البيانات» فعلى سبيل المثال» يتطلب تأسيس 
بنية تحتية للبيانات مهندسي برامج وأجهزة ومسئولين رقميين. وأخصائيين في السياسة وخبراء 
مجالات علمية ومحللين. فهؤلاء العاملون يضمنون تصحيها ينا للنظام ي ينتج بيانات 
مفيدة وصحيحة وموثوقة, ويوفرون الوسائل الضرورية لتخزين ومشاركة البيانات» ويؤمنون 
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مجموعة من الأدوات التحليلية والإدارية المناسبة:. التي يمكنها استخلاص القيمة والمعرفة. 
وهم يعرفون أيضًا ماهية الأسئلة التي ينبغي توجيهها وما الذي يتعين فعله بالإجابات على تلك 
الأسئلة. ولذاء فإن المواهب البشرية بضاعة رائجة. ولكن وكما أشارت بعض التقاريرء هناك 
نقص متزايد في الموظفين الذين يتمتعون بمهارات في البيانات وخاصة محلاي ومديري البيانات 
الذين بإمكانهم تحويل البيانات والمعلومات إلى معارف وعلوم (:2011 اءقصاع8 0ه ماصهة 0 
2 [إعطه80 :2012 .21 أء طقطد :2011 .له ع معلتتجصه/3). 


وقد أكد (2012:3) .21 ]© ه>لنترصة31 " أن الولايات المتحدة وحدها تعاني نقصًا يبلغ 
٠ه‏ إلى ١1١,٠٠٠‏ شخص يتمتعون مهارات تحليلية متعمقة وكذلك ١,0‏ مليون مدير 
ومحلل من أجل تحليل البيانات الكبيرة واتخاذ القرارات بناءً على اكتشافاتهم". واستطردوا 
بالإشارة إلى أن مثل هذه المواهب "من الصعب إيجادها إذ تستغرق سنوات عديدة في 
التدريب أو إعادة التدريب" (ص .)٠١‏ وقيم (2012) .21 ]© 5025 عدد 00٠١‏ موظف في 
اثنتي عشرة شركة عاطية فيما يتعلق بمقدرتهم على معالجة تحليلات البيانات بشكل مثمر 
حيث قاموا بوضع الموظفين في ثلاث مجموعات. الأولىء التجريبيون غير المعترضين الذين 
يثقون في التحليلات أكثر من الأحكام الشخصية (457). والثانية. متخذو القرار المتعمقون 
الذين يتجاهلون التحليلات ويتصرفون با يمليه عليه حدسهم الفطري (611). والثالثة, 
المتشككون المطلعون (/7) الذين يوازنون بين الأحكام الشخصية والتحليلات. ويسعون 
إلى تفسير البيانات ووضعها في سياقها المناسب عند اتخاذ القرارات. وبشكل مقلقء فإن 
أولئك الذين يدعون البيانات تعبر عن نفسها وأولئك الذين يتجاهلون البيانات والتحليلات 
بشكل روتيني يفوقون في عددهم أولئك القادرين بشكل أفضل على فهم البيانات الكبيرة. 
وعلاوة على ذلكء لاحظوا أن الشركات تعاني من أربعة مشاكل تحول دون الاستفادة من 
إمكانيات البيانات الكبيرة وهي: 


٠.‏ أولاً: أن المهارات التحليلية تتركز في عدد محدود للغاية من الموظفين ولا تنتشر في باقي 
الموظفين. 

٠‏ ثانيا: أن حلول تقنية المعلومات تتركز بشكل تقليدي على التقنية وبشكل أقل بكثير على 
المعلومات في حين أن المعلومات هي المجال الذي يتم من خلاله جني القيمة. 
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٠‏ ثالثاً: أن تخزين البيانات يحدث كيفما اتفق ومن الصعوبة بمكان على أي موظف أن 
يحدد مكان المادة إذا لم يكن هذا الموظف هو المسئول عن جمعها. 


٠‏ رابعاً: أن المديرين يفهمون قيمة الموهبة ورأس المال والعلامة التجارية ولكن لا يفهمون 
قيمة المعلوماتء ولا يبذلون جهوداً كافية من أجل فهم البيانات أو ترتيب هذه 
البيانات بشكل فعال وكفء. 

ويوجد مثل هذا النقص ف المهارات أيضًا في المؤسسات الأكاديمية. حيث إن خبراء 

ا مجالات المختلفة تدربوا في وقت ندرة البيانات وهم غير مستعدين بشكل كبير لعصر 

البنى التحتية للبيانات والبيانات الكبيرة وذلك باستثناء عدد لا يتجاوز أصابع اليد الواحدة 

من العلماء وامراكز. 


إن القلق الذي ينتاب الكثير من المعلقين هو أن المنافع المحتملة من الشركات والعلوم 
التي تقودها البيانات لن يتم تحقيقها بشكل كامل بسبب نقص المواهب البشرية وخاصة 
علماء البيانات الذين تجتمع لديهم مهارات مبرمجي البرامج والإحصائيين والرواة المحترفين 
وذلك من أجل استخلاص شذرات الذهب المختبئة تحت جبال من البيانات (1462ن01 
60 والذتريق الذين شيمون قفي قغويل هذه الشترات إل :قرارات حتكيمة: نوفيا 
يتعلق بالمديرينء وكما أشار (23 :2012) .41 © 58 فإن "الاستثمار في التحليلات يمكن 
أن يكون بلا جدوىء ويمكن حتى أن يكون ضاراً إلا إذا كان بإمكان الموظفين دمج هذه 
البيانات في العملية ال معقدة لاتخاذ القرارات". فالجامعات بدأت الآن في إنشاء برامج 
جديدة ومراكز بحثية لعلوم البيانات» ويسعون إلى تعديل الدورات التدريبية الحالية لكي 
تشتمل على التدريب على مجموعة المهارات الجديدة هذه. وذلك في مسعى إلى تنقيح 
بعض الثغرات المتعلقة بال مهارات. ويتم تنظيم بعض هذه البرامج با مشاركة مع بعض 
الشركات. فعلى سبيل المثال» بدأت شركة آي بي إم (182/1) بالفعل في العمل مع العديد من 
الجامعات من أجل تطوير دورات ومقررات تعليمية. وهناك بعض الشركات الأخرى مثل 
شركة تيراداتا (16720262) التي تقدم برامج تدريبية معتمدة من الجامعات (ك1)016ء8 
3 وذلك على الرغم من أن هذه البرامج من الممكن أن تؤدي إلى مخاطرة توجيه 
الطلاب تجاه رؤى وبرامج خاصة ببعض الشركات. 
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الجدول رقم ١(‏ - 4) 


الخبرات اللازمة لبناء البنى التحتية للبيانات وإجراء بحوث البيانات الكبيرة 


خبرات المجال 


115ء معت 100123112 


خبرات البيانات 


115 م83 103162 


الخبرات التحليلية 
عقتالء معد ادع نا لهسم 


٠‏ معرفة نظرية وعملية عميقة بالمجال (المجالات) ذات الصلة. 

« المعرفة التامة بأنواع البيانات التي ستتم دراستها وأصل هذه البيانات 
وأهميتها للمجال (المجالات) ذات الصلة. 

« المقدرة على تحديد الفجوات ال معرفية. 

« المعرفة التامة بالأدبيات والاتفاقيات النظامية. 

« المقدرة على تعليم الآخرين الذين يملكون خلفيات متعددة من أجل 
استيعاب كل ما ذكر أعلاه. 

« فهم كيف يتم تجميع البيانات والمحافظة عليهاء وكذلك فهم العلاقات 
بين الأشياء المادية والتمثيل الرقمي لهذه الأشياء (إذا كان ذلك ممكنا). 

٠‏ المعرفة التامة بنماذج البيانات و/ أو اتفاقيات وصف البيانات. 

« فهم كيف يتم الوصول إلى البيانات ذات الصلة وتخزين هذه البيانات. 

٠‏ المقدرة على تسهيل مشاركة البيانات وتصحيح الأخطاء بشكل يدوي» 
سواءً كان هذا أثناء أم بعد المشروع. 

« المقدرة على التنبؤ بالاستخدامات المستقبلية أو البديلة للبيانات. 

٠‏ فهم الأشكال الجديدة من اللمطبوعات التي يمكنها أن تحتوي على البيانات. 


٠‏ فهم نقاط القوة والضعف في أدوات البحث الفردية. 


٠‏ اختيار وتعديل الأدوات المناسبة لدعم الأهداف البحثية. 

« التنبؤ بالمشاكل التي يمكنها أن تنشأ مع استخدام الأدوات المختارة 
لتنفيذ مهام المشروع. 

« توقع واكتشاف معدلات الأخطاء في خوارزميات البيانات وتحليلات 
البيانات. واختيار الطرق الإحصائية التي تفسر هذه الأخطاء كلما كان 


ذلك مناسبا. 
٠‏ تعليم الآخرين كيفية تفسير نتائج البحث. 





1لا ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها 


القضايا الفنية والتنظيمية 


خبرات إدارة المشاريع «المقدرة على صياغة معام اطمشروع. 
1286126124 10606 | . المقدرة على تحديد الأهداف المناسبة والمواعيد النهائية وتنسية 
15 وي مسارات العمل اللتوازية إذا كان ذلك ضروريا. 


«٠المقدرة‏ على اختيار أفضل الإستراتيجيات المناسبة للاتصال والتوثيق 
للمشروع. 

« إجادة الأدوات البحثية التعاونية. 

« الإرادة القوية للعمل من أجل تحقيق النتائج التي تفيد جميع أعضاء 
الفريق. 


المصدر: مقتبس من (20 - 16 :2012) تإتتصعآط لصه 871114010ا. 


إن علم البيانات ليس هو الخبرة الوحيدة التي يتعين تأسيسها. وبحسب ما ادعى 
(2012) لإنقصع11 سه 507111104 فإن تأسيس بنى تحتية للبيانات وإجراء البحوث على 
البيانات الكبيرة يتطلبان دمج أربعة أنواع من الخبرات من أجل تحقيق النجاح (انظر 
الحدول .)3-١‏ وهذه الخبرات الأربعة كما ادعى (2013) 8116616 يمكن أن يتم تحقيقها 
فقط من خلال منهج متعدد التخصصات والقطاعات, مما يسمح بتوحيد المهارات والرؤى 
التي يمكنها أن تتقاطع مع المجالات وتحقق التعاون بين المؤسسات الأكاديمية والصناعية 
والحكومية. وحتى يأتي مثل هذا الوقتء أي عندما يتطور وينضج جيل جديد من ا مواهب 
المناسبة» وتتطور مناهج متعددة المجالات والأنظمة, فإن المشروعات ستظل عرضة للإخفاق 
أو سوء الأداء. 





الخاتمة: 

كشف هذا الفصل عن أوجه النقص الفنية في البيانات الصغيرة المتوسعة والبيانات 
الكبيرة. وناقش أن البيانات الكبيرة تحيط بها العديد من القضايا التي تحول دون الاستفادة 
منها وتطويرها في الوقت الراهنء» ومن هذه القضايا على سبيل الذكر لا الحصر النطاق 
الضيق إلى حد ما لمجموعات البيانات المتوافرة. والوصول المحدود إلى البيانات» والجودة 
الضعيفة للبيانات. وصحة وموثوقية البيانات. وسلالة أصل البيانات المحددة بشكل سيئ» 


ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة, والبنى التحتية للبيانات, والنتائج المترتبة عنها الا 


الفصل التاسع 


والتبادلية الضعيفة: والتحليلات المشكوك فيهاء والمغالطات البيثية. وقاعدة المهارات المطورة 
بشكل ضعيفء والاستحابة المؤسسية. وقد أدى ذلك ب (2012) .21 )أ تعاوهطصء 1 
للادعاء بأن "التحركات الأولية ربما تكون واعدة بشكل مفرط ولكن أداءها ربما يكون أقل 
من المتوقع". وخصوصاً عندما يصيح هؤلاه الذين يتبنون حلول البيانات الكبيرة "مُتهمين 
بسبب التقنية التي لا تزال حديثة للغاية وغير منقحة, ل 
أكثر من كونها مفيدة". وبمرور الوقتء فإن الكثير من هذه القضايا سيتم التعامل معها إلى 
حد ما وذلك من خلال الحلول الإدارية والفنية. ولكن ستظل هذه القضايا تشكل مخاوف 
وافنظلي اعدواما مرا عملا إضلاعيا متعدد ا .ورتطيق: الأمز ؤاقه أيضا مان مقاروغات 
البنى التحتية للبيانات ومشروعات البيانات المفتوحة. وفي الواقع, وكما أشرنا إلى ذلك في 
الفصل الثالثء فإن الكثير من هذه القضايا التي تؤثر على البيانات الكبيرة تؤثر بشدة في 
مشروعات البيانات المفتوحة. فعلى سبيل المثال. فإن بعض مواقع البيانات المفتوحة لا تعد 
أكثر من كونها مقالب نفايات للبيانات ذات المتغيرات الانتقائية إذ إن هذه ا مواقع منظمة 
بشكل سين للغاية وهي ذات بنية ضعيفة تماماً وبياناتها غير نظيفة: وهي تفتقر إلى 
مجموعات التسجيل الكاملة: والتوثيق» والسياسات المتعلقة بالحفظء والنسخ الاحتياطي» 
والتدقيق» وإعادة الاستخدام:. والخصوصية والسياسات الأخلاقية. 


امير يتعين علينا ينا أن نكون حريصين للغاية من 0 0 ندرك 7 0 البيانات لا تزال 


الراهن, يبدو أن التسابق يتجه نحو 595 نظم تها تهدف له استعراض الإمكانيات 3 حصة 
سوقية مبكرة دون بذل الجهد الكافي لتفحص المصداقية والفعالية وا منفعة, أو لتفحص 
القضايا الإدارية واموارد البشرية التي تتعلق بالجاهزية المؤسسية ومجموعات المهارات 
ا مناسبة. وفي الواقع. فإن شعار بعض المشروعات هو أن تتجه نحو ما هو مستهجن بشكل 
مبكر ثم تتعامل مع القضايا التي تنشأ على أساس انتشارها. 

ونتيجة لذلك, فإن البحوث المركزة بشكل كبير وا مصممة من أجل تحديد طبيعة ومدى 
أوجه القصور الفنية والمؤسسية للبيانات الكبيرة والبيانات اللفتوحة والبنى التحتية للبيانات 
لا تزال متأخرة بشكل واضح مقارنة بأعمال التطوير الأخرى. ولكن مثل هذه البحوث 


ا ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها 


القضايا الفنية والتنظيمية 


تظل حيوية للغاية لإنشاء أنظمة تقدم اكتشافات ونتائج صحيحة. ومن شأنها أيضًا أن 
تضيف قيمة كافية للمؤسسات التي تتبنى وتستخدم هذه البحوث. ويتعين أن يتم إجراء 
هذه البحوث عبر قطاعات متعددة وعبر الأنواع المختلفة من البيانات وذلك من أجل 
تأسيس القضايا والحلول المتعلقة بالبيانات والأنظمة المختلفة. وعلاوة على ذلكء يتعين أن 
يتم تخصيص استثمارات من أجل زيادة وصقل مهارات ال موظفين الحاليين وتدريب جيل 
جديد من علماء البيانات» ودون إجراء مثل هذه البحوثء فإن البيانات الكبيرة» والبيانات 
المفتوحة والبنى التحتية للبيانات ربما ستعاني أضرار السمعة التي ستؤدي في نهاية المطاف 
إلى بطء في نشرها وتبنيها. وهناك مجموعة أخرى من القضايا التي ستؤدي الدور ذاته 
وهي القضايا المتعلقة بالآثار الأخلاقية والاجتماعية والسياسية لأنظمة البيانات الجديدة, 
وهو ما يركز عليه الفصل التالي. 


ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة, والبنى التحتية للبيانات, والنتائج المترتبة عنها ا 
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الفصل العاشر 
المخاوف الأخلاقية, والسياسية, والاجتماعية, والقانونية 


(1125ع©2011) 1.821 220 رلم1ء50 رلدهء20113 ملمعتطاظ) 


كما نوقش في الفصل السابع.: يتم تكوين وتوظيف البيانات للعديد من الغايات التي 
تشمل حكم المجتمعات, وإدارة المنظمات, والتوسع في الأرباح» وتنظيم الأماكن. وفي جميع 
هذه الغالات» كر البيانات مدخلات أساسية في الأنظمة التي يتم تنفيذهاء للمفارقة, لغرض 
أن تكون المجتمعات أكثر أماناء وأمناء وتنافسية» وإنتاجية, وكفاءة, وشفافية ومساءلة. على 
الرغم من أنه يتم القيام بذلك من خلال العمليات التي تراقب وتفرض النظام: وتكبح: 
وتقنع, وتجبر. وتستغل الناس. فهناك توازن دقيقء في هذه الحالة: بين استخدام البيانات 
بطرق تحريرية وتمكينية» وبين استخدام البيانات من أجل تحقيق أغراض الفرد الشخصية 
وإلحاق الضرر بالآخرينء أو استخدام البيانات بطرق تتعارض مع رغبات هؤلاء الذين 
تمثلهم هذه البيانات. ولا يتعلق الأمرء مع ذلك. بأن تستخدم البيانات ببساطة في أشياء 
جيدة أو أشياء سيئة, فالمشكلة أعقد من ذلك بكثير. وفي غالب الأحيان فإن النتائج التي 
تظهر على أنها متعارضة يتم تجميعها سوياً لدرجة أن الأشخاص يمكن تحريرهم أو إجبارهم 
في الوقت نفسه - وهم يحصلون على منافع شخصية في الوقت ذاته الذي يقعون فيه 
في مصيدة النظام الذي يسعى إلى تحقيق مكاسب من وراء مشاركتهم. وفي مصطلحات 
(1971) 1ء5وناطغآى. تعمل مثل هذه الترتيبات من خلال الاستجوابء وتوريط الناس عن 
طريق منطقها وذلك من خلال الإقناع والحوافز. فعلى سبيل المثالء تمنح بطاقات الولاء في 
الأمواق للعملاء خصومات في الوقت ذاته الذي تعمل هذه البطاقات على تأسيس الولاء 
تجاه المتجر وتكوين قدر من البيانات التي يتم استخدامها من أجل محاولة بيع المزيد من 
البضائع لهؤلاء العملاء. مما يؤدي إلى زيادة الأرباح. وبا مثل: فإن تمن حصولك على الأمان 
من الهجمات الإرهابية هو المراقبة التي تنتهك خصوصيات جميع الأفراد في المجتمع» حيث 
يحصل المواطنون على الأمان مقابل خصوصيتهم. 


ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة, والبنى التحتية للبيانات, والنتائج المترتبة عنها َك 


الفصل العاشر 


إن تكوين البيانات والعمل الذي تقوم به مثل هذه البيانات محاط بشكل جوهري 
بمخاوف أخلاقية: واجتماعية. وسياسية. ومثل هذه المخاوف كانت لوقت طويل مثار 
إدراك ومجادلات داخل المنتديات العامة والمنتديات العلمية: مما أدى إلى صياغة مجموعة 
كبيرة من الإرشادات الأخلاقية وامهنية والتشريعات التي تحدد كيف يتم إنتاج إدارة, 
مشاركة, واستخدام البيانات. فليس هناك أي شكل من أشكال إنتاج وتحليل البيانات خال 
من مثل هذه المخاوف. وحتى المشاريع العلمية التي يبدو من الناحية الظاهرية أنها غير 
خطرة ومحايدة» يمكن أن تثير أسئلة أخلاقية ويكون لها توابع اجتماعية وسياسية. فعلى 
سبيل المثالء ربمما يبدو ظاهريًا أن قياس ونمذجة الأنظمة البيئية يكون مقتصراً على فهم 
الظواهر الطبيعية» ولكن من الممكن أن يتم استخدام ذلك أيضًا في تشكيل السياسات التي 
تؤثر في حياة الناس داخل مثل هذه الأنظمة. إن مثل هذه الحوارات الأخلاقية مستمرة 
وتتطور واحدة تلو الأخرى مع المجال الاستطرادي الأشمل الذي يتعلق بالاتجاهات والآراء 
الاجتماعية» وتطور التقنيات الجديدة. وفيما يتعلق بالأخيرة. فإن توسيع البيانات الصغيرة 
داخل البنى التحتية للبيانات. وإنشاء سوق البيانات الهائل: وفتح البيانات امؤسسية, 
وتدفقات البيانات الكبيرة يطرحان أسئلة أساسية أخلاقية: واجتماعية. وسياسية: إذ إنها 
تعدل بشكل جذري مشهد البيانات. إن حجم وتنوع البيانات التي يتم تكوينها عن جميع 
مجالات الحياة اليومية والعام الذي نعيش فيه اليوم ينموان بشكل مطرد, وهذه البيانات 
هي أكثر من أي وقت مضى من حيث مناسبة توقيتهاء وتصميمهاء وشموليتهاء وترابطها. 
فما كان في الماضي عاضا آم مهو أصبح الآن وبشكل متزايد مكشوفاً أمام مجموعة 
متنوعة من المصالح. وعمليات اتخاذ القرار داخل الحكوماتء وأصبحت الأعمال توجه 
بالبيانات بشكل أكبر. ومدعومة بالدليل وأكثر اعتمادًا على التقنية (تكنوقراطية). 

يناقش هذا الفصل مجموعة مختارة من ال مخاوف الأخلاقية, والاجتماعية, والسياسية, 
والقانونية التي تثيرها ثورة البيانات. وهذه المخاوف تشمل مراقبة البيانات وتعقب 
البيانات» والخصوصية» وأمن البيانات» والتشخيص. والتصنيف الاجتماعي والخطوط 
الحمراء (1528ه011) والتي تعني ممارسة الحرمان أو زيادة التكلفة في الخدمات لمناطق 
لها غالبية عرقية محددة بناء على البيانات» والتحكم في الانسلالء والحوكمة التوقعية, 
وحوكمة المؤسسات. والاعتماد التام على التقنية وحوكمة الشركات والإغلاق التقنيء والملكية 


لل ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة» والبنى التحتية للبياناتء والنتائج المترتبة عنها 


المخاوف الأخلاقية. والسياسية, والاجتماعية» والقانونية 


وحقوق املكية الفكرية. فالفصل يناقش كيفية التفكير في كل قضية من هذه القضاياء مع 
الآراء المتباينة داخل كل علم على حدة وبين العلوم المختلفة بعضها البعضء وكذلك داخل 
وبين الشركات والحكومات والمجتمع المدنيء ومن لديه أجندات مختلفة. ومصالح مكتسبة. 
وحساسيات سياسية. ولذاء فإنه لا توجد إجابات سهلة لحل هذه القضايا التي يناقشها 
هذا الفصل: ف حين أن العلول فتكوق ذوما من :نويات وعلول وسط: وم االؤكنم عن 
ما ذكرناء أنه كلما تنتشر ثورة البيانات. فمن المرجح أن تزداد حدة ال مناقشات والجدال 
بشأن هذه المخاوفء وخصوصاً عند القيام بمحاولات من أجل صياغة تشريعات جديدة 
للتعامل مع التطورات التقنية التي تساعد على انبثاق طرق جديدة لإنشاء وتعزيز وتحليل 
البيانات. ومن ثم تؤدي إلى ظهور قضايا جديدة مما يجعل من التشريعات والقوانين 
القديمة تشريعات وقوانين عفا عليها الزمن. 


تعقب البيانات ومراقبة البيانات (ع 10262711122 220 512200135 10212): 

كما ناقشنا في الفصول السابقة» يتم تكوين كمية هائلة من البيانات في الوقت الراهن 
وذلك فيما يتعلق بالمواطنين في جميع ولايات الدولة. إن إنتاج وتحويل مثل هذه الكمية 
من البيانات ينمو ويتزايد باطراد. حيث تسعى الدولة والشركات ومنظمات المجتمع المدني 
بشكل فعال للحصول على البيانات المتعلقة بمواطنيهم وعملائهم والأعضاء المشتركين في 
أنشصطتهم. وفي الواقع. أصبح من الصعوبة بمكان أن يؤدي الفرد جزءًا من حياته اليومية 
دون أن يترك أثرًا لذلك بسبب الدور غير المباشر للتقنيات الرقمية والبرامج واستخدام 
المعرفات الدالية (2011 ء10008 324 صنطءغ1؟1). فحتى ولو م يقم المشتري باستخدام 
بطاقته الائتمانية لشراء البضائع من المتاجرء إلا أن حضور هذا ا مشتري قد تم تسجيله 
من خلال كاميرات المراقبة» وحتى لو استخدم الشخص اسم مستخدم مجهول على وسائل 
التواصل الاجتماعي فإنه يتم تسجيل عنوان بروتوكول الإنترنت (8007655 12) وعنوان 
التحكم بالوصول للوسائط (5و8007 8]40). ومن ثم فنحن نترك آثار البيانات بشكل 
روتيني في أعقابناء على الرغم من أننا في الغالب لا نمتلك السيطرة الكاملة على شكل ومدى 
وكيفية استخدام هذه الآثار. 
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وكما أشار (2011) 5زههكآ. على سبيل المثالء فإن هيئة حماية البيانات الهولندية 
قدرت أن المواطن الهولندي العادي مندرج في نحو 0٠١0 - 70١‏ قاعدة بيانات» في حين 
أن المواطنين الأكثر نشاطاً من الناحية الاجتماعية مندرجون في نحو ٠٠٠١‏ قاعدة بيانات. 
ولا تشتمل قواعد البيانات هذه على الآثار الرقمية للمواطنين فحسب «البيانات التي 
يتركها المواطنون أنفسهم في أعقابهم). ولكنها تتضمن أيضًا بيانات الصور التخيلية (102:8 
75 الخاصة بالأفراد (البيانات عن المواطنين التي ينشئها الآخرون)» وهي توفر 
بشكل متزايد عملية تعقب البيانات الخاصة بالموقع والتفاعلات والمعاملات عبر الممكان 
والزمان (2011 5م100 :2005 صطنتطء )1 لصد عع1200 :2007 حمتججآا به1994 عامهات). 
وعلاوة على ذلكء ففي حين أن الآثار الرقمية والصور التخيلية للبيانات سريعة الزوال ولا 
تدوم إلا فترة محدودة للغاية» فإن النسخة الرقمية منهما تدوم بشكل كبير للغاية ويمكن 
تخزينها في قواعد البيانات لفترة غير محدودة (2011 10025): مما يؤدي إلى إنشاء 
عاط من الممكن له أن يتذكر جميع نقاط البيانات ولا ينسى على الإطلاق (220 ء12018 
2007 صنطء1>1). فهذه الآثار الرقمية والصور التخيلية للبيانات يتم تفتيتها وتقسيمها 
ونشرها عبر الكثير من ال منظمات والخوادم» وهي تكون عرضة للدمج والتقسيم (تإ©1121 
3. وفي أفضل الأحوال. تشكل الآثار الرقمية والصور التخيلية للبيانات القليل من 
الرؤى - رؤى محدودة من زوايا مرتفعة جزئية من مواقف محددة مع إسقاط الرؤى 
المحددة (2002 غ131 ط1' 220 سنتصك) - وذلك بدلا من تمحيص هذه الآثار والتخيلات 
سوياً من أجل تكوين رؤية شاملة وعامة تحيط بكل شيء. وعلى الرغم من ذلككء وإذا 
وضعنا في اعتبارنا ارتباطية البيانات وقيمة تضخيم البيانات» فإن الاتجاه السائد سيكون 
تجاه تجميع وجهات النظر المحدودة من أجل تكون تصور أكثر قوة. 

وإجمالا. توفر الآثار الرقمية والصور التخيلية للبيانات سجلاً مفصلاً بحياة المرء اليومية, 
وأنماط استهلاكه. وعمله. وسفره. واتصالاته» ولعبه. وتفاعلاته مع ا منظمات,. وأفكاره 
واهتماماته. وليس الأفراد فحسب هم من يقعون تحت طائل هذه المراقبة الشاملة. ولكن 
هذه ال مراقبة تشمل أيضًا الأشياء والمؤسسات والتعاملات والمناطق (صنطء؛ك1 همه ءع3ه20 
25). وم يحدث أبدا ف السابق أن يتم تكوين مثل هذه الكمية من البيانات عن حياة 
الناس الاقتصادية والاجتماعية بسهولة بالغة» وأن يتم إتاحة هذه البيانات على نطاق واسع 
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للغاية من خلال أسواق البيانات والبنى التحتية للبيانات ومبادرات البيانات المفتوحة. 
وق الواقف فإن اكتنساب الوضول إل البيانات: الحساسة ليس مقفضرا غلى الحكومات 
والشركاك والمنظمات» ولق سيب أن مراقية النظراء أصبهعت أمرا أكثر اتتفيبارا بشكل 
نسبي دون معرفة أو دون الحصول على إذن الشخص الخاضع للمراقبة 71ء لصم 
7. وبالطبع: كان هذا الأمر متاحاً على الدوام من خلال التطفل والقيل والقالء ولكنه 
أصبح أكثر سهولة في الوقت الحالي من خلال الإنترنت سواءً كان هذا من خلال البحث عن 
البيانات أو شراء تلك البيانات» أو من خلال استعراض سحلات الأجهزة الرقمية كالهواتف 
الخلوية» وبرامج تصفح الإنترنت» أو برامج الملاحة بالأقمار الصناعية في السيارات... وغير 
ذلكه أو من خلال وضع أجهزة مراقبة رخيصة نسبياً مقل الكاميرات الدقيقة المصخرة. وكما 
ناقشنا في الفصل الثاني. فإن سماسرة البيانات يسمحون بدراسة تواريخ الأشخاص وذلك 
فيما يتعلق ببعض المسائل مثل الحالة الاجتماعية, والإفلاسء وملكية العقارات» والتاريخ 
الوظيفيء والسجلات الجنائية» والحالة الضريبية ودعاوى العنف الجنسي أو العنف الأسريء 
والخلفية التعليمية... وغير ذلك. 

ومن ثم فإن طوفان البيانات مكشوف أمام مراقبة البيانات والاستغلالء فمراقبة 
النياناته تصن أحد أساليب اللمراقبة التي يتم تفعيلها من خلال فرز وتدقيق مجموعات 
البيانات وذلك بغرض التحديد وامراقبة. والتتبع. والتنظيم, والتنبؤء والتوجيه 
(2013 121697 :1988 01221): وتعمل مراقبة البيانات على تحويل الكميات الهائلة 
من الأفعال والأفكار التي تمثلها هذه البيانات إلى صورة واضحة ومقروءة ونماذج 
واضحة للحكم على الأشياء (359 :2004 .21 013276): وهي مكون أساسي من 
الأشكال الحديثة للحوكمة والحاكمية. وفيما يتعلق باستخدام البياناتء وكما ناقشنا 
في الفصل السابع: يتم استخدام البيانات من أجل توصيف واستهداف الأشخاص 
وذلك بهدف زيادة الأرباح. ومن ثم ففي غالب الأحيان يتم إعادة تحديد الغرض 
من البيانات واستخدامها في أغراض م تكن مقصودة على الإطلاق عند تكوين هذه 
البياناتء. ومن ثم فإن مراقبة الآثار الرقمية والصور التخيلية للبيانات يثيران العديد 
من المخاوف الإضافية وخاصة فيما يتعلق بقضايا مثل الخصوصية. والتنميط والفرز 
الاجتماعيء وإقرار أساليب متعددة للحوكمة. 
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الخصوصية (2217527): 

الخصوصية هي حالة يتوقعها ويقدرها الكثير من الناس. وهي تُعَنُ حقاً من حقوق 
الإنمان الأساسية. وهي من الحقوق المقدسة في الكثير من القوانين الوطنية والدولية. 
وفي الولايات المتحدة. فإن الخصوصية مغطاة بشكل كبير في القوانين الممسماة قوانين 
الخصوصية: أما في الاتحاد الأوروبيء فهي تقع ضمن نطاقات قوانين حماية البيانات 
(2013 .21 ]© 1لاعصن3). والخصوصية مصطلح متعدد الأبعاد فيما يتعلق بمعناه. وهو 
يستخدم في غالب الأحيان في طرق معتمدة على السياق, ولكن على وجه العموم هو 
يشير إلى ال ممارسات المقبولة فيما يتعلق بالوصول إلى والإفصاح عن ال معلومات الشخصية 
والحساسة (2011 1652270514 210 8115000). ومن الوسائل ال مستخدمة في إيضاح 
الأبعاد المتعددة للخصوصية دراسة الوسائل العديدة التي يمكن من خلالها انتهاك 
الخصوصية والأضرار ا مرتبطة بهذه الانتهاكات, (2006 501076, انظر الجدول رقم 10.1). 
فالذي يتضح لنا من خلال هذا التصنيف هو أن انتهاك الخصوصية يمكن أن يكون له 
العديد من التأثيرات على الرفاهية الحسدية والعاطفية للأفراد. ويجعل هؤلاء الأفراد 
عرضة للأنشطة المضرة التي يقوم بها الآخرونء ويجعلهم كذلك عرضة لاختلال توازن 
السلطات غير المتماثل. 


ويوجد بعض الشكوك بأن مفهوم الخصوصية يتغير. وكما تمت الإشارة أعلاه. فإن الناس 
عرضة الآن لمستويات من الفحص والتدقيق وكذلك أساليب المراقبة أكثر من أي وقت مضى. 
فالمهام التي كانت تعد في الماضي خاصة إلى حد كبيرء يتم الآن مراقبتها وتسجيلها. على 
سبيل المثال» فإن البرامج التي كان يشاهدها الشخص على التلفاز لم تكن معروفة في الماضي 
إلالمن هم حاضرون مع الشخص ذاته في الغرفة ذاتها في حين أنه يمكن لشركات التلفاز 
الآن مراقبة ما الذي يتم مشاهدته على كل تلفاز على حدة وذلك بسبب استبدال البث 
التلفزيوني وحيد الاتجاه بالتواصل ثنائي الاتجاه. وما يشتريه المرء كان في السابق معروفا 
للعميل والشخص الذي يخدم هذا العميل فحسب والآن أضحت هذه ال معلومات التي يتم 
جمعها بشكل روتيني من خلال إدراج النقود الرقمية في عملية الدفع متاحة لشرائح أكبر. 
والأماكن التي كان يسافر إليها الفرد لم تكن سابقاً معروفة إلى حد كبير لأي شخص ما عدا 
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المسافرين ومرافقيهم: ولكن في الوقت الراهن أضحى العديد من الأنظمة تكشف موقع 
الشخص والطرق التي احجتازها كنظم املاحة باستخدام الأقمار الصناعية (625) اطثبتة 
في السيارات أو أجهزة الهواتف الخلوية ونظام تثليث الإشارات في أبراج شبكات الهاتف. 
وأنظمة النقل العام التي تعتمد على استخدام شريحة تحديد الهوية باستخدام موجات 
الراديو (8711) في أنظمة أو أكشاك دفع رسوه المرور. ومثل هذه البيانات التي تنتجها 
هذه الأنظمة يتم إعادة تجميعها ونشرها وبيعها. 


)٠١ - ١( الجدول رقم‎ 


تصنيف الخصوصية 


جمع ال معلومات 1214011226005 
دمتاء»0011© تجواب الأشكال المتعددة من الاستجواب أو التقصي من أجل 
الحصول على ال معلومات 


الإهمال في حماية ا معلومات المخزنة من التسريبات 
والوصول إليها بطريقة غير ملائمة 
الاستخدام الثانوي | يتم استخدام ا معلومات التي تم تجميعها لغرض معين 


معالجة المعلوماث اه ٠‏ 5-8 
في اأغراض أخرى دون الحصول على موافقة الشخص 


10385 1101:12:1011 موضوع البيانات 


الإخفاق في السماح للشخص موضوع البيانات 
بمعرفة البيانات التي يمتلكها الآخرون عنه وا مشاركة 
في معالجة واستخدام هذه البيانات» وهذا يشمل 
الإقصاء والمنع من التمتع با مقدرة على الوصول إلى 
هذه البيانات وتصحيح الأخطاء الواردة فيها. 





ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة, والبنى التحتية للبيانات, والنتائج المترتبة عنها ا 


الفصل العاشر 


الكشف عن المعلومات عن شخص ما والتي تؤثر في 
الطرق التي يحكم بها الآخرون على شخصيته 
نشر ال معلومات 


مك1 


1> 


استخدام هوية الشخص موضوع البيانات من أجل 


بعد تدخل المتعلق | التدخل في قرارات الشخص موضوع البيانات التي 
ك1 بالقرارات تتعلق بشئونه الخاصة. 





المصدر: تم تجميعه من (2006) 501076. 

وعلاوةٌ على ذلك. فنحن نعيش في عام أكثر انفتاحاً وشفافية بكثير عما اعتدنا عليه سابقا. 
فالمعلومات التي كانت تُعدٌ خاصة في السابق يتم مشاركتها الآن بشكل أكثر حرية كالسير 
الذاتية من خلال موقع لينكد إن (1415هذآ). والصور والفيديوههات العائلية من خلال 
مواقع فليكر (111>2) وإنستحجرا ام (متورع ة)ئم1) ويوتيوب (10111115). والقصص الشخصية 
والعائلية من خلال موقع فيسبوك ©72665001) والمدونات, والأفكار والمعتقدات الشخصية 
من خلال تويتر (151]17) وغرف الدردشة والتعليقات على الإنترنت. فما كان يتم مشاركته 
في السابق مع عدد لا يتجاوز أصابع اليد الواحدة من الأشخاص كأفراد العائلة, والأصدقاء 
المقربينء وأرباب العمل في المنزل أو المقهى المحلي أو مكتب للموارد البشرية يتم نشره الآن 
على المستوى العالمي مما يسمح لأي شخص بمشاهدته وتعديله (2013 .21 ع نلاعهذ/3). 
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وعلى الرغم مما ذكر سابقاً لا يتصرف كل شخص بسهولة وبحرية فيما يتعلق ببياناته 
الشخصية. حتى ولو كان الشخص يتصرف على هذا النحوء فإنه لا يتوقع بالضرورة أن هذه 
البيانات سوف يتم انتقاؤهاء ومعالجتهاء وتجميعهاء وبيعها. وهم لا يتوقعون أيضًا أن 
تطبيقات البرامج التي لا يوجد بها أي عنصر من عناصر وسائل التواصل الاجتماعيء والتي 
يعتبرونها تطبيقات خاصة ربما تقوم بتكوين ونقل البيانات إلى مطوري تلك التطبيقات أو 
أن بعض الشركات ربما تحاول أن تقوم بالهندسة العكسية لإستراتيجيات حماية الخصوصية 
مثل إخفاء الهوية من أجل إنشاء ملفات شخصية موحدة. ومع ذلك. فإن هذا الأمر 
يحدث بانتظام. على سبيل ال مثال» وجدت صحيفة وول ستريت جورنال ©6عع562 11/011 
01221]) في اختبار أجري على 101 تطبيق للهواتف الذكية, أن 56 تظبيقاً نقلت معرف 
الجهاز المتفرد للهاتف إلى شركات أخرى وذلك دون معرفة المستخدم أو الحصول على 
موافقته. وأن 47 تطبيقاً أرسلت موقع الهاتفء وأن 5 تطبيقات أرسلت البيانات الشخصية 
للمستخدمينء وأن 45 تطبيقاً لم يكن بها أي ارتباط مع سياسات حماية الخصوصية التي 
يمكن للمستخدمين مشاهدتها (2011 .21 6»© 8521). كما وجدت شركة الثقة الإلكترونية 
(187539) أن خاافقظ من عن موتلا قطبيها مرسطوق بسامة الخصوضية وأق متاتهر 
شركتي أبل وجوجل يشترطان ضرورة اشتمال التطبيقات على هذه السياسة (6017111© 
1). ومع ذلك. وكما أشار (2011) 21 ]© 6:8118.: بمكن للتطبيقات أن تتتبع وتنقل 
"عاداتك على الشبكة. وأن تبحث في قانئمة جهات الاتصال لديكء وأن تجري مكالمات 
هاتفية دون أن تعرفء وأن تتتبع موقعك. وأن تفحص ملفاتكء وغير ذلك الكثير". 

إن مشهد الخصوصية الآن في حالة تغير مستمرء وهو يخيب كلاً من التوقعات القانونية 
والاجتماعية» وبالنسبة للبعضء فإن مفهوم الخصوصية قد تعطل بشكل كبير (متةطاسة ]1 
3 ع صطفكآدءط11 :2008). ويرى البعض أنه من الصعوبة بمكان المحافظة على الخصوصية 
في التطبيق العمليء كونها تحجب وتخفي تجربة ا مستخدمء وهي معوق اقتصاديء ولا يبدو 
أن معظم الناس يعارضون أن يتم التنقيب في بياناتهم, وإذا لم يكن لديك شيء لتخفيهه فما 
المشكلة في أن يتم معرفة بياناتك؟ (2007 501076 :126 :2013 7إ©1021). وبالنسبة للبعض 
الآخرء فإن الخصوصية حق يتعين حمايته لأنه من الحقوق التأسيسية ل "المواطنة المطلعة 
والمتأملة" وهو مكون أسامي أيضًا لحرية التعبير (2009 صهك0370:1). وعلى هذاء يُرى أن 
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الخصوصية "سمة ضرورية وتأسيسية للأنظمة السياسية الديموقراطية المتحررة" (دعاه© 
2. فإذا تم إنكار الأشكال المتعددة من الخصوصية التي تم إيجازها في الجدول 
رقم »203١-1١(‏ فإن الناس سيكونون عرضة لأنوع مختلفة من الأضرار الشخصية وأشكال 
الحوكمة الأكثر ضرراً. ويبدو أن جميع المعلقين يؤيدون وجهة النظر القائلة بأن تشريعات 
الخصوصية لم تعد ملائمة للغرض التي شرعت من أجله. وأنه يتعين تحديث تلك التشريعات 
لكي تلائم الأوقات التي نعيشها الآن. 
الجدول رقم (5 - )٠١‏ 
مبادئ الممارسة العادلة للمعلومات 


المبداً 


الإخطار (ع21066) يتم إخطار الأفراد بأن بياناتهم يتم إنشاؤها ويتم إعلامهم بالغرض 
الذي سيتم استخدام هذه البيانات فيه 


الاختيار (عء1مطن) يتمتع الأفراد بحرية اختيار ا مشاركة أو يؤثرون عدم امشاركة وذلك 
فيما يتعلق ما إذا كانوا يرغبون في استخدام بياناتهم أو الإفصاح 
عنها وكيفية القيام بذلك 


الموافقة (غصمعقصهك) يتم إنشاء البيانات والإفصاح عنها فحسب بعد موافقة الأفراد 


الأمن (طدهء5) يتم حماية البيانات من الفقد. وإساءة الاستخدام: والوصول غير 
المصرح به والإفصاح عنهاء وتعديلها أو تدميرها. 


التكامل (1167ع1266) 


منها 


المساءلة (رانازطهغمدهءعة) | يكون مقتني البيانات مسئولا عن ضمان تحقق المبادئ السابق 
ذكرها وأن يكون لديه الوسائل اللازمة من أجل ضمان الالتزام بهذه 
اطمبادئ 





المصدر: 156 :2013) .21 هء تلاعصتل/8). 
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الجدول رقم (" - )٠١‏ 
أنواع المعلومات المحمية 


المعلومات الشخصية المعرفة | المعلومات الحساسة: هي أي | المعلومات الأخرى التي يمكن 
(811): هي أي معلومات تعرف | معلومات يمكن للكشف غير | استخدامها لتخمين هوية شخص 
شقصا ما يصورة شاهرة أو غير | اللصترع لها أن نسبب الإحراج أو | ها 

شرة الضرر لشخص ما 


اق لقعا لق 


العنوان البريدي / الرمز البريدي | الآراء السياسية هوية ملف تعريف الارتباط 
(عك1مم») 


ل سي 


رقم الجوال / الهاتف عضوية النقابات التجارية 


لضا الجا |سلييت اسسية/صلية | 0000 | 


الجنسية 
سدسمي إسر ‏ | 000000 





امصدر: مقتبس من 159 :2013) .31 اء للاعصنا8). 


وفي الوقت الراهن: فإن تشريعات الخصوصية مبنية حول الحقوق الشخصية وا موافقة 
ا متعلقة بإنشاء. واستخدام: والإفصاح عن البيانات الشخصية (2013 501076). وهي تتكون 
من سبعة مبادئ عالمية للخصوصية (156 :2013) .21 © 312111 (انظر الحدول رقم 7ط )٠١-‏ 
وفي إطار هذه المبادئ, فإن الأفراد. من الناحية النظرية:» يتم منحهم الحق للتحكم في بياناتهم 
الشخصية ومنح موافقتهم للآخرين فيما يتعلق بهذه البيانات. وعلاوة على ذلك فإنه يتعين على 
مقتنيي البيانات الالتزام بقوانين حماية البيانات التي تقيد الإفصاح عن المعلومات الشخصية 
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امعرفة (211 -1210128105 ع2014261ع11 7والحده5ةء2): والمعلومات الحساسة:. والبيانات 
الأخرى التي يمكن استخدامها للاستدلال على الشخصية (انظر الجدول رقم »23١-٠‏ وتؤيد تقليص 
البيانات بحيث يقتصر إنشاء البيانات على البيانات الضرورية لتحقيق غرض معين (200 عمع]” 
2 :1و]عدو1ه2). وعلى وجه العموم: فإن الحل لاشتراطات المعلومات الشخصية ا معرفة 
(211) هو استخدام أساليب إخفاء الهوية مثل عدم تحديد الهوية (إخفاء المعلومات الشخصية 
ا معرفة)» والأسماء المستعارة» والتجميع, بالإضافة إلى التشفيرء والتخزين الآمنء والقيود الخاصة 
بالوصول إلى المعلومات (2011 111ع001). 

وأخيراً تجدر الإشارة إلى وجود العديد من المشاكل الإدراكية والبنيوية المرتبطة 
بتشريعات الخصوصية الحالية. 

وتحاول الدول بصورة روتينية التحايل على قوانين الخصوصية وذلك من أجل أغراض 
الأمن وجمع المعلومات الاستخباراتية. بحسب ما تم الكشف عنه مؤخرا بواسطة برامج 
تحليل وجمع البيانات السرية في الولايات المتحدة الأمريكية, والمملكة المتحدة. والعديد من 
الحكومات الأخرى (انظر الفصل السابع). كما أن الكثير من الشركات لا تشعر بأنها مجبرة 
على تقديم سياسة الخصوصية للأفراد وذلك لأن هذه الشركات تدعي أنها تجمع معلومات 
مجهولة المصدرء ومن ثم فهي لا تقع تحت طائلة ممارسات المعلومات العادلة. أو ربما 
تقدم هذه الشركات سياسة الخصوصية, وذلك عند الاستهلال الأولي للالتزامات (على سبيل 
المثالء عند تثبيت برنامج ما أو الاشتراك في خدمة ما) وتكون هذه السياسة مصاغة بلغة 
معقدة وغامضة: وعادة ما تشتمل على الاحتفاظ بالحق في تعديل هذه السياسة في وقت 
لاحق دون تشاور إضافي مع الشخص (2013 داعغقصذطن1). 

وفيما يتعلق بالبيانات التي تم تكوينها بدون معرفة الشخص. فمن الصعوبة بمكان 
اكتشاف مثل هذه الممارسات ومواجهتها من الناحية القانونية. أما في حالة الخصوصية 
ذات الإدارة الذاتية. وكما شرح (2013) 501076: فهي ببساطة مرهقة للغاية وبالغة 
الصعوبة على الأفراد كونها تتطلب قيامهم بتنظيم خصوصيتهم عبر الكثير من الكيانات, 
وا موازنة بين التكاليف وامنافع المرتبطة با موافقة على الشروط والبنود دون معرفة كيف 
سيتم استخدام هذه البيانات في الوقت الحالي وفي المستقبلء وأيضًا تقييم التأثيرات الشاملة 
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والتراكمية لبياناتهم التي سيتم دمجها مع مجموعات البيانات الأخرى. وبناء على ذلك. 
أشار (2013) 501076 إلى أن: 
(1) الناس لا يقرؤون سياسات الخصوصية؛ (2) إذا قرا الناس سياسة الخصوصية, 
فإنهم لا يفهمونها؛ (3) إذا قرأ الناس سياسة الخصوصية وفهموهاء فإنهم في الغالب 
يفتقدون الخلفية الكافية لاتخاذ اختيار مبني على المعرفة؛ (4) وإذا قرأ الناس سياسة 
الخصوصية وفهموهاء وكان بإمكانهم اتخاذ اختيار واع ومبني على المعرفة: فإن 
اختياردهم ممكن أن ينحرف وذلك من جراء العديد من الصعوبات المرتبطة باتخاذ 
القرار (1888 :2013 ع501057). 
ومن ثم فإن الموافقة تكون في غالب الأحيان ممارسة عديمة الجدوى (صاعغومءطن1 
2 »2 وذلك عندما يقوم الأفراد عن غير قصد بالتخلي عن الحقوق دون إدراك ممدى أو 
عواقب الفعل الذي يقومون به. ومن ثم» فإن سياسات الخصوصية في غالب الأحيان تخدم 
إخلاء المسئولية للشركات بصورة أكبر مما تخدم عملية ضمان الخصوصية للمستهلكين, 
(2012 كطؤوء20102 0ه ممع1). وعلاوة على ذلك. فمن الواضح أنه في عصر البيانات 
الكبيرة» فإن إستراتيجية إزالة التعرف على الأشخاص توفر شكلاً ضعيفاً فحسب من أشكال 
الخصوصية لأن من الممكن القيام بالهندسة العكسية للعملية وذلك من خلال التنقيب في 
مجموعات البيانات وتجميعها (2010 12361107ط5 220 منمصحج:112137). فعلى سبيل امثال» 
يشرح نيف سينحر (512861 11[17) من شركة تراكسك (عه1') (والمقتبس في اء 11اعم1/1 
1 31) عملية إزالة التعرف على الأشخاص كما يلي: 
يمكن في بعض الأحيان أن يكون من الصعوبة بمكان توحيد املفات الشخصية 
الاجتماعية المستخدم واحد والذي ربما يستخدم العديد من الأسماء أو تعاملات 
مختلفة في كل واحدة من شبكات التواصل الاجتماعي» ولذا فلقد قمنا ببناء 
خوارزميات تقوم بالتنقيب في العوامل الأساسية التي تشتمل على محتوى 
المشاركات والموقع على سبيل المثال لا الحصر, وذلك من أجل توفير توحيد للهوية 
بشكل فعال إلى درجة كبيرة. 
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ونتيجة لهذه المخاوف. يدرس الاتحاد الأوروبي منذ فترة سياسات حماية البيانات (انظر 
امفوضية الأوروبية 2011 5م100 :2011 .21 أء هلط .2012 55102 ماه مع م0 1نا 
23 11«2ع111125). وتشتمل اقتراحات الاتحاد الأوروبي على أن تكون ا موافقة صريحة 
وليست ضمنية أو مفترضة. وأن يكون وصول الأفراد إلى البيانات الخاصة بهم مهل وشناماد: 
وأن يكون للأفراد الحق في قابلية النقل للبيانات بمعنى المقدرة على نقل البيانات الشخصية 
من مزود خدمة إلى مزود آخرء والحق في أن يتم نسيان الشخص.ء حيث يكن للأفراد أن 
يطلبوا حذف بياناتهم إذا لم تكن هناك أي أسس مشروعة للاحتفاظ بهذه البيانات» وأن 
تنطبق هذه القواعد أيضًا على الشركات خارج الاتحاد الأوروبي إذا كانت هذه الشركات عاملة 
في سوق الاتحاد الأوروبي وتقدم خدماتها مواطني دول الاتحاد الأوروبي (2012 621م110ا1 
999 ووباطمثلء. تقدمت مفوضية التحارة الفيدرالية ف الولايات المتحدة 
الأمريكية باقتراح يتضمن ثلاثة تعديلات من أجل توفير حماية أكثر فعالية للخصوصية: 
الخصوصية من خلال التصميم حيث يتم تأسيس الخصوصية بشكل متأصل في كل مرحلة 
من مراحل تطوير المنتج؛ منح الشركات وا مستهلكين خيار مبسط بمنحهم المقدرة على 
اتخاذ القرارات بشأن بياناتهم الخاصة. وهذا يشمل تطبيق آلية لعدم التتبع والحصول على 
الموافقة الصريحة فيما يتعلق بالبيانات الحساسة. أو الحصول على موافقة قبل استخدام 
البيانات في غرض مختلف بشكل مادي عن الغرض الذي تم من أجله تكوين هذه البيانات؟؛ 
وشفافية أكثر فيما يتعلق بالبيانات وجمعها واستخدامهاء وهذا يشمل الوصول المعقول 
إلى البيانات من قبل هؤلاء الذين تمثلهم تلك البيانات. مع منحهم المقدرة على تصحيح 
أو حذف البيانات (مفوضية التجارة الفيدرالية 2012 55102تتصحدهن ع1520' لدمعلع). 
وتنشد إستراتيجية الخصوصية من خلال التصميم تطبيق إستراتيجية مختلفة عن الالتزام 
التشريعي والتنظيمي. وهي تقترح أن تكون الخصوصية هي الوضع الافتراضي للعملية؛ 
أي نظام يسعى بفعالية وبوضوح إلى ضمان الخصوصية (2009 087011425). ومن شأن 
المبادئ السبعة المذكورة في الجدول رقم (© - )٠١‏ أن تعزز هذا المنهج. 


ل ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة, والبنى التحتية للبيانات, والنتائج المترتبة عنها 


المخاوف الأخلاقية. والسياسية, والاجتماعية» والقانونية 


الجدول رقم (© - )٠١‏ 


ا مبادئ السبعة الأساسية للخصوصية من خلال التصميم 


استباقية وليست تفاعلية؛ | ينبغي أن تسعى نظم تكنولوجيا المعلومات لتوقع الخصوصية 


الوقاية وليس العلاج تحديد المخاوف المتعلقة بالخصوصية وتجنبها بدلاً من السعي 
إلى حل المشاكل الناتجة عن مخالفات الخصوصية بعد حدوثها 


الخصوصية هي الوضع الافتراضي | الخصوصية محمية تلقائيا ولا تتطلب أي عمل من جانب الأفراد 


الخصوصية مدمجة في التصميم | حماية الخصوصية هي سمة أساسية للتصميم والهندسة الهيكلية 
لأنظمة تقنية المعلومات وليست ميزة إضافية متدنية الأهمية 


الفعالية الكاملة - عائد إيجابي | جميع المصالح والأهداف المشروعة يتم استيعابهاء بدلا من أن 

وليس محصلة صفرية يكون هناك مقايضات بين الخصوصية واعتبارات أخرى مثل الأمن 

الأمن من النهاية للنهاية-حماية | تكون الخصوصية جزءًا لا يتجزأ من النظام من بداية إطلاقه إلى 
كاملة طوال دورة حياة النظام | حين التخلص منه 

الوضوح والشفافية - فلتكن | تكون جميع الأجزاء المكونة للنظام وعملياته واضحة وشفافة 

مفتوحة على الدوام للمستخدمين والشركات الموفرة على السواء وتخضع لتدقيق مستقل 

احترام خصوصية المستخدم - أي | يجب أن يبنى النظام حول الأفراد, وأن يحمي مصالحهم, وأن 
جعلها تتمحور حول ا مستخدم | يكون مُمكنًا لهم 

المصدر: (2009 صهعلته0كة0). 





لقد اقترح العديد من العلماء ا متخصصين في الخصوصية وأيضًا العديد من مجموعات 
الضغط الصناعية مناهج متعددة لكيفية التعامل مع قضية الخصوصية:. فالعلماء 
المختصون بموضوع الخصوصية سبق لهم التطرق للمواضع التالية: الإصلاح التشريعي 
المصمم من أجل حماية حقوق المواطنينء والذي يشمل بعض القضايا كالحق في الصفحة 
البيضاى وتواريخ الانتهاء للبيانات (0892011ه1): .ومن الذي يكون مسغولاً عن ضمان 
الخصوصية: المطورون أم الوكالات أم المستخدمونء وعن الوسائل التقنية والإدارية 
لتنفيذ هذه الأمور (2011 111:ء001). وما الذي يشكل المعلومات الخاصة وكيفية تأطير 
القصوضية# عضول المضاطر ومدى الشرر يدلا فى تأطيرها سول تعريق اللحقوى ممم 
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1 .31 ]»). واقترح هؤلاء العلماء أيضًا دخول الأفراد في شراكات مع المطورين حيث 
يكون بإمكانهم أن يختاروا بشكل أكثر استباقية ما البيانات التي يرغبون في نشرهاء 
ولمن تنشر هذه البيانات» وتحت أي ظروف تنشر هذه البيانات. كما اقترحوا أن تتيح 
الشركات للمستخدمين الوصول إلى بياناتهم الشخصية بصيغة قابلة للاستخدام وذلك من 
أجل مصلحتهم الشخصية. وأخيراء اقترحوا أن تقوم الشركات بمشاركة الثروات الناتجة 
عن تحويل البيانات الشخصية إلى أموال (صتءاقصنطن1 :2012 نوائغعمه1ه2 ممه عمع]” 
3. وكمثال على هذه المشاركة المفيدة لكلا الطرفين في الثروات المتحصلة من بيع 
بيانات الشبكات الذكية حيث يتم استخدام البيانات التي تم تكوينها من خلال العدادات 
الذكية والمتعلقة باستهلاك أفراد الأسرة للكهرباء من قبل شركة الكهرباء من أجل ضمان 
كفاءة التزويد بالكهرباء. ويتم مع ذلك توفير تطبيقات لأفراد الأسرة لتمكينهم من مراقبة 
استخدامهم الشخصي وأن يعدلوا سلوكياتهم من أجل توفير المال. إن سوق الصناعة, إلى حد 
كبير» يُريد إما الاستمرار في الإمدادات الحالية على ما هي عليه أو تقليل هذه الإمدادات, 
مع إدارة الخصوصية من خلال تنظيم يقود السوق ولا يكبح الاستفادة الاقتصادية من 
البيانات. وفي هذه الحالة, فمن المتصور أن الشركات سوف تقوم بعملية التنظيم الذاتي 
خشية حدوث أضرار بسمعة تلك الشركات أو أن يعبر عملاء الشركات عن عدم رضاهم من 
خلال عدم التعامل مع هذه الشركات إذا انتهكت هذه الشركات خصوصية هؤلاء العملاء 
بشكل مبالغ فيه (2013 تع كلنان 0ه معو طدمطك 5تع :2127 :2013 .21 اع الاعصنتك8). 


أمن البيانات (11ناءع5 10262): 

مع وضع قيمة البيانات في الاعتبارء وخاصة البيانات الشخصية التي يمكنها أن تسهل 
سرقة الهوية: أو البيانات التجارية التي يمكن قرصنتها أو استخدامها من أجل تحقيق ميزة 
تنافسية. أصبح أمخ المانات معالا هافا في حماية البيانات. فالأفراد يمكنهم فتح العديد 
من الحسابات سواءٌ الحسابات الشخصية أو حسابات العملء مع العديد من الهيئات 
والبائعين وذلك باستخدام العديد من رموز الهوية الشخصية وأسماء ا مستخدمين وكلمات 
السر. فالبيانات المتعلقة بهؤلاء الأفراد. والبيانات الشخصية الخاصة بهم: يتم تخزينها في 
الكثير من الأماكن (على سبيل المثال أجهزة الحاسب الآلي» والأجهزة الرقمية: والهواتف 
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الذكية. ومحركات الأقراص الصلبة الخارجية: وأجهزة تخزين البيانات المتنقلة مثل (17518آ 
21) والخوادم. وتكون هذه الحسابات والأجهزة الرقمية عرضة للقرصنة (الدخول على 
الحسابات أو الوصول إلى الأجهزة)» والبرمجيات الخبيثة (الرموز التي يتم تثبيتها بشكل 
سري على جهاز الحاسب والتي يمكنها الوصول إلى المعلومات الحساسة أو تسجيل ضغطات 
لوحة المفاتيح وترسل هذه الأشياء إلى طرف ثالث). والانتحال (58نطونط2) (الرسائل 
الإلكترونية الاحتيالية أو الهندسة الاجتماعية من خلال المكالمات الهاتفية التي تحاول أن 
تجعل الشخص يتطوع بتقديم معلومات حسابه)» مما يؤدي إلى سرقة واختلاس البيانات. 

وقد ناقش 2011) 5»1مزع1 220 2غ022) بالتفصيل خمسة مستويات لأمن البيانات» 
وكل مستوى من هذه المستويات له محركات مختلفة إلى حد ماء وذلك على الرغم من أن 


القالى: 

)١(‏ الخصوصية: من أجل المحافظة على المعلومات وتقييد تداولها. 

() الامتثال والالتزام: من أجل حماية البيانات التي من المحتمل أن تكون قابلة للكشف 
عند التقاضيء أو الخاضعة لشروط الاستبقاء. 

(؟) الاحتراز: من أجل حماية البيانات التي يمكنها أن تؤدي إلى أو تساعد على سرقة الهوية. 

(©) السرية: من أجل التأكد من حماية المعلومات السرية مثل الأسرار التجارية. 

(0) التأمينء من أجل حماية المعلومات عالية السرية مثل الصفقات التجارية: والملفات 


الشخصية. والسجلات الطبية» والمعلومات العسكرية: التي يمكن أن يكون لها تأثير 

يتجاوز السرقة الشخصية. ْ 

وتعد إذارة المسعويات الخمسة السايقة لأمن البيانات مُهمة بالغة الأهمية بالنسبة للأقراد 
والشركات والمؤسسات. وعلى وجه العموم: يتم إنجاز هذه المهمة من خلال التحكم في الوصول 
عبر برامج الأمن وتصميم النظام / الشبكات (على سبيل المثال تثبيت جدار ناريء وبرامج 
لاكتشاف ومكافحة الفيروسات.ء والرسائل غير المرغوب فيهاء وحصان طروادة:» والبرمجيات 
الخبيثة). والتشفير الذي يتطلب كلمة سر لفتح الملفات المغلقة. وإذا وضعنا في الاعتبار أنه 
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بمجرد أن يتم الوصول إلى البيانات فسوف يصبح من السهل نسخها ونشرهاء فإن إدارة الحقوق 
الرقمية تسعى لتقييد مثل هذه الممارسات وأن تجعل من السهل أيضًا تتبع تلك الممارسات. 

ومع ذلكء وعلى الرغم من هذه التهديدات, فإن الأجهزة الرقمية والخدمات والبيانات» 
ونقاط الضعف المحتملة في تهيئتهم: تزيد بسرعة أكبر من المقدرة على تأمينهم (2اهه© 
1 اإاءنصنعظ لصة). وفي حين أن الكثير من أجهزة الحاسب الشخصية وأجهزة الحاسب 
المحمولة آمنة بصورة نسبية مادامت برامج الحماية الخاصة بها تحدّث بشكل دوريء 
إلا أن أجهزة الحاسب اللوحية: والهواتف ال محمولة: وأجهزة الفاكسء ومحركات الأقراص 
الصلبة الخارجية» والأجهزة الطرفية (مثل الطابعات. وأجهزة المسح الضوئء وآلات تصوير 
المستندات الشبكية). والعدد الهائل من الأجهزة التي تشكل إنترنت الأشياء عادة ما تتمتع 
بحماية قليلة (2013 2056 :2013 2ه5معطمء56 لصه 5ع0م»2626). وقد أدى ذلك ب 
3) و5حصذك8) إلى الادعاء بأنه بمجرد وجود أي شيء في بيئة تشتمل على رمز رقمي ويتم 
توصيله بالشبكة. فيمكن قرصنة هذا الشيء من خلال كائنات يحتمل أن يتم التحكم بها 
عن بعد. أو يتم إجبار ذلك الشيء على تجاوز معايير التصميم, أو العمل بطرق غير مريحة 
أو خطرة: أو يضلل اللمستخدمين مما يؤدي إلى حدوث الأخطاء والأضرارء أو يتجسس على 
الساكنين أو اللمستخدمين. وعلاوة على ذلكء فإن الطرق المستخدمة من قبل القراصنة أو 
امحتالين أصبحت أكثر تعقيداً وعدوانية عن السابقء وأن صناعة الأمن 55 في سباق من 
أجل مواكبة هؤلاء القراصنة وا محتالين (2012 عه ط6010). 

فمع تطور ثورة البيانات» ووفرة المزيد من الأجهزة التي تُنتج» وتتبادل وتستخدم 
البياناتء يبدو أن القضايا والمخاوف الأمنية مُعرضة للازدياد وليس التقلص (.21 )»© #اصه © 
7). وهذا بدوره سيؤدي إلى تفاقم الجرائم مثل سرقة الهوية. وتقوض الثقة في نظم 
البيانات. ورفع سلسلة من المسائل القانونية المتعلقة بالمسؤولية والالتزامات تجاه حماية 
النظم عندما يتم العبث بالبيانات» واختلاسها وسرقتها (2010 مءداء18). 
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التشخيص. والتصنيف الاجتماعي والخطوط الحمراء ([2ك50 رعقسنلقمعءم 
كستستللع1 لحنه عستاتءره5): 

بعيداً عن توسيع محيط المراقبة, وانتهاك الخصوصية:؛ ونقاط الضعف المتعلقة بأمن 
البيانات» تأني المخاوف بشأن ماهية المجالات التي يتم فيها توظيف فيضان البيانات لتحقيق 
أشياء معينة. وكما أشرنا إلى ذلك في الفصل السابع؛ لم تتغير طبيعة البيانات فحسبء ولكن 
يوجد أيضًا تحول نوعي في الكيفية التي يتم بها تحليل البيانات, وفي أي الغايات يمكن 
استخدام البيانات وتحليلات البيانات» ومن لديه السلطة لاستخدام واستخلاص القيمة من 
البيانات. فالبيانات كانت تستخدم لوقت طويل من أجل تنميط وتقسيم وإدارة السكان,» 
ولكن هذه العمليات أصبحت في الوقت الراهن أكثر تعقيداء ودقة. وانتشارًاء وانتظاما 
عن ذي قبل بكثير. وفي حين أن الهيئات الحكومية تكون ملفات شخصية للأفراد وذلك 
من أجل أغراض الأمن ورصد الاحتيالء إلا أن معظم النمو في عملية التنميط يتم من قبل 
الشركات التجارية والتي تسعى إلى فهم واستهداف قاعدة المستهلكين الحالية والمحتملة 
(انظر الفصل الثاني). 

ففي الماضيء كانت الشركات تقوم بالتسويق الجماعيء» ونشر رسالة عامة إلى حد ما 
وسط مجموعة كبيرة جدا من الجمهور وذلك من خلال الإعلان الجماعي باستخدام التلفاز 
والراديوء والطباعة, والبريد الإلكترونيء وذلك من أجل الوصول إلى المجموعة المستهدفة 
لتلك الشركات (2011 501076 300 تاقة157ء5). وبمرور الوقتء تم تعزيز هذا الأمر 
من خلال التسويق المستهدف وذلك باستخدام التنميط الخام بشكل نسبي. وهناء قامت 
مجموعة صغيرة من الشركات ال متخصصة بتكوين تصنيفات عامة للسكان حيث تم تصنيف 
الأسر إلى أصناف ذات ملفات شخصية عامة. والتي كانت في العادة يتم تسميتها من خلال 
اختيار متغيرات ومواقع دبموغرافية» على سبيل المثال باستخدام بيانات الإحصاء السكاني 
أو البيانات التي تعكس أسلوب الحياة كاستخدام بيانات الاشتراكات في دوريات معينة 
على سبيل المثال (1995 6055). وبدلاً من محاولة تنميط عملائهم الشخصيينء ترغب 
الشركات في شراء الملفات الشخصية وبيانات الاتصال وذلك من أجل تقسيم واستهداف 
أصناف معينة من السكان من خلال رسالة مؤطرة بدقة» وفي الوقت نفسه تحقيق الفعالية 
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في ميزانية التسويق من خلال تقليل مصروفات الإعلانات المبددة. وف الآونة الأخيرة, 
بدأت شركات التنميط في إنشاء ملفات شخصية فردية بدلاً من الملفات الشخصية العامة 
وذلك من خلال تجميع البيانات من مصادر عدة مثل معاملات البطاقات الاثتمانية 
ومعاملات بطاقات المتاجرء ومسارات النقرء والمشاركات في وسائل التواصل الاجتماعي» 
والعديد من أنواع البيانات الشخصية الأخرى (2013 ©5165). وعلاوة على ذلك. تستفيد 
الشركات ذاتها من الكميات الهائلة من البيانات التي تنشئها عن العملاء على سبيل المثال» 
من خلال المطبيعات ومسارات النقر وإدارة علاقات العملاءء وتجميع هذه البيانات مع 
المصادر الأخرى للبيانات وذلك من أجل تكوين الملفات الشخصية الخاصة بهم والاشتراك 
في التسويق السلوي. 

هنا من الناحية الظاهرية. يبدو أن التنميط التنبئي موقف مربح للجميع. للعملاء 
والبائعينء فالعملاء يحصلون على معاملة شخصية ومخصصة. في حين يحصل البائعون على 
مبيعات أكثر ويقللون من النفقات. ولكن وفي المقابلء فإنه يمكن استخدام التنميط التنبئي 
من أجل تصنيف الناس من الناحية الاجتماعية واستبعاد فئات منهم من خلال اختيار 
أصناف معينة منهم للحصول على وضع تفضيلي وتهميش واستبعاد الآخرين (تصقطه© 
9 1116 ط1' 220 امطورء.]آ : 2005). فعلى سبيل المثال» ممكن للشركة تنميط الناس فيما 
يتعلق بمخاطرهم الائتمانية وما هي احتمالية مقدرتهم على الوفاء ببسداد مدفوعاتهم: أو 
فيما يتعلق بقيمة حياتهم المتوقعة إذا ما ظلوا في برنامج الولاء. وما هي احتمالية تغييرهم 
لعاداتهم (2013 .21 » 1ااعم3841). ومن خلال استخدام مثل هذه ال ملفات الشخصية 
والتنميطء يمكن للشركات تحديد الأولويات لاهتماماتهم ومواردهم, وذلك يتم عادة من 
خلال التركيز على العملاء ذوي القيمة العالية. ومن ثم يتم قياس وتصنيف العملاء بشكل 
منتظم ويحصلون على خدمات تفضيلية» وبعضها يكون تمييزياً مثل استبعاد السكان الذين 
يُحَذُونَ بلا فائدة (لن يحققوا مكاسب للشركة). أو لن يحققوا مكاسب كافية» أو أن المخاطر 
ا مرتبطة بهم عالية مما ممكن أن يؤثر بدوره على الفرص الحياتية (هصصة1 :1997 تهت 
95 113 11797177 :2002 631077 8201). فهذه ال ملفات الشخصية تعتبر منتجات ويمكن 
بيعها لشركات أخرى تكون مهتمة في تقييم قيمة ومخاطر العملاء المحتملينء ومن ثم فإن 
النتائج السلبية يمكنها أن تطال الشخص عبر الأماكن وعبر الأزمنة. 
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ومثل هذه الممارسات التمييزية يمكن أن تشتمل على تسعير فعال وشخصيء فمن الأمور 
الشائعة بالفعل في سلاسل المتاجر أن تكون السلعة ذاتها مسعرة بطرق مختلفة عبر المتاجر 
المختلفة وذلك استناداً إلى خصائص وسمات السكان الذين يتسوقون من هذه المتاجن أو 
أن يكون سعر المتفجات مختلفاً وفق الكمية المشتراة (مغلاً المنتج الواحد بدولار في حين أن 
القلاثة مات بدؤلارين)» أو آن تسلف الأبحار باغتلاق الجماعات (مغفلاً حصول الطلات 
أو المواطنين الكبار في السن على تخفيضات) (1996 1882188). وتتمثل رغبة الكثير من 
الشركات في تداول مثل هذه الممارسات على أسس فردية» ومعدلة لكي تناسب ال ملفات 
الشخصية. وذلك حتى يدفع أناس مختلفون أسعار مختلفة للمنتج ذاته (كما هي الحال 
مع أسعار تذاكر الطيران ولكن بناءٌ على نموذج مخصص). وتراوح الأسعار أيضًا بشكل فعال 
ووفق السياقء بناء على الظروف. وقد بدا بالفعل تطبيق مثل هذه الممارسات الشخصية 
والمرنة» مما في ذلك قطاع المتاجر. فعلى سبيل المثالء تطرق (2012) 011804 إلى أمثلة تبين 
أن المنسوقين يدفعون في المتجر ذاته أسعار مختلفة للمنتج ذاته وذلك استناداً إلى ملف 
العميل الشخصي. وفي بعض الحالات. تقوم المتاجر بتعديل الأسعار وقت تسوق العملاء 
وذلك بناءً على موقعهم داخل المتجر وتاريخ التسوق لهؤلاء العملاء حيث يتم منح القسائم 
الإلكترونية في الموقع عندما يقوم المتسوقون بمسح المنتج باستخدام التطبيقات في هواتفهم 
الخلوية. إن الهدف من وراء التسعير الشخصي والفعال هو الحصول على كامل فائض 
القيمة المتاح في المعاملة وذلك من خلال تسعير البضائع والخدمات لأقرب سعر ممكن 
من السعر الاحتياطي (سعر التحفظ) لدى الفرد (17 :2012 تواواعده1ه2 ممه عمع1)» 
وبعبارة أخرىء فإن هذا مصمم للاستفادة من الإنفاق المثالي لمصلحة المتجر. 

وبالنظر إلى قدرتهم على تشكيل وتصنيف خبرات ال مستهلكين والفرص الحياتية» فإن 
الملفات الشخصية للأفراد والبيانات وممارسات البيانات التي تدعمها بحاجة إلى اهتمام أكبر. 
وفي الوقت الحاليء فإن كلاً من البيانات المستخدمة والتحليلات المطبقة مبهمة وغامضة 
بالنسبة للمستهلكين والمواطنين, فإذا انتهى الأمر بالشخص مدرجاً على قائمة الممنوعين» أو 
تم معاملته بشكل سلبيء أو تم استبعاده من منتج ما من قبل شركة ماء على سبيل المثال تم 
وضعه في القائمة السوداء للحصول على الائتمان. فمن الصعوبة بمكان تحديد الأسس لهذا 
التمييز ومجابهة هذه الأسباب. فالنقاد يدعون بأننا قد ولجنا عضي حيث: 


ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة, والبنى التحتية للبيانات, والنتائج المترتبة عنها ا 


الفصل العاشر 


ربمايتراءى للبعض أن لبنية البيانات أو الصورة التخيلية للبيانات ميزة وجودية, ولكنها 
بالقعيل 3اكاميرة معودية. إن هنا تقول نعرة بباناتك هدك أكر حقيقة وصدنا هما نقولة 
أنت عن نفسك. فبنية البيانات هي البنية التي تم الحكم عليك من خلالها في ا مجتمع: 
وهي البنية التي تملي وتفرض وضعك في العام فما نشاهده عند هذه الفترة من الزمن هو 
غلبة التمثيل على الكينونة (1995 ع[طتطعقصظ تك لدعناتين). 

وعلى الرغم من ذلك فنحن نعرف أن البيانات الكبيرة وبنية البيانات فوضويان - فهما 
ممتلئان بالثغرات. والمتناقضات والأخطاء (انظر الفصل التاسع) - ونعرف أيضًا أن البرامج 
والخوارزميات تعمل بطرق انتقائية ومتحيزة (2011 ع10008 20ة صنطءغ)ة؟1). ومن ثم 
فإن الأنظمة التي تعتمد على البيانات الكبيرة. والتي لا تعد شفافة وتفتقد إلى التدقيق 
اللازم وحق الرجوع الملائم»ء تطرح جميع الأنواع المحتملة من المشاكل وذلك عندما يمنحون 
الأفضلية لبنية البيانات. وفي الواقع. فإن الوقت أصبح ملاما الآن أكثر من أي وقت مضى 
للرقابة القانونية والتنظيمية على التنميط التنبئي. وعلى الإجراءات التي تشوش على التمييز 
الوجودي للبيانات وتحمي الناس من الممارسات التمييزية والضارة. 


الاستخدامات الثانوية والتحكم في الانسلال والحوكمة الاستباقية (,وء105آ 0012357ء56 
6017111211 21017 رع نامك لله عع نان [ماصمت). 

إن أحد الأسس التي تستند إليها سياسة الخصوصية وحماية البيانات في الاتحاد الأوروبي 
وأمريكا الشمالية هو مفهوم تقليص البيانات. وهذا ا مفهوم يشترط أن تقوم الهيئات 
والبائتعون بإيجاد البيانات الضرورية فحسب لأداء مهمة ماء بمعنى أن يتم الاحتفاظ 
بالبيانات طاًا كان ذلك ضروريا لأداء هذه المهمة أو كما تمليه الاعتبارات القانونية. وأن 
البيانات التي يتم تكوينها يتعين استخدامها فحسب من أجل هذه المهمة (لصه عمع]” 
2 :و 1واعم2010). ومعنى آخر لا يتعين على جامعي البيانات أن يستولوا على أي شيء 
يمكنهم الاستيلاء عليه» ولا يتعين عليهم كذلك تخزين هذه البيانات ,لدة غير محدودة أو 
أن يتيحوا هذه البيانات لاستخدامات ثانوية. ومن الواضح أن هذه التطلعات والطموحات 
تتعارض مع المبادئ والأمس المنطقية للبيانات الكبيرة وعمل أسواق البيانات التي تسعى إلى 
تكديس البيانات في حال كان من ال ممكن أن تكتسب هذه البيانات أي قيمة في ا مستقبلء 
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(2013 عايع زع تلص :2012 تجاواعده1ه20 لصهد عدع]). فالحل أمام البائعين تمثل في إعادة 
تقديم البيانات من خلال إزالة الأجزاء التي تشير لهوية الأفراد من هذه البيانات أو إنشاء 
بيانات مشتقة. مع إخضاع مجموعة البيانات الأساسية فقط لعملية تقليص البيانات. ويمكن 
في هذه الحالة بيع البيانات العاد تقديمها أو استخدامها بعدة طرق ومثل هذا الأسلوب 
لإعادة تحديد الغرض من البيانات أمر شائع. حيث يجادل البائعون أنه لا توجد حاجة 
لإبلاغ الشخص الذي تشير إليه البيانات أو الحصول على موافقته. حيث إن هذه البيانات 
مجهولة المصدر.ء ومشتقة ومحجمعة (2007 501076). وهذا الحصاد ال محتمل للكميات 
الهائلة من البيانات» والذي تم الحصول على معظمه دون معرفة أو فهم الأشخاصء والذي 
يتم استخدامه بعد ذلك في استخدامات ثانوية» يثير الكثير من الأسئلة الأخلاقية التي لا 
تتعلق بالخصوصية وحماية البيانات فحسب. بل تتعلق كذلك بالحوكمة؛ ومن الأمثلة 
الواضحة والمتعلقة بالحوكمة هو التحكم في الانسلال. 

إن التحكم في الانسلال يحدث عندما تكون البيانات التي تم إنشاؤها لشكل من أشكال 
الحوكمة مشابه لشكل آخر (2001 265م]). وحدث هذا غالباً بشكل شديد الوضوح فيما 
يتعلق بالأمن وخصوصاً بعد أحداث الحادي عشر من سبتمبر. حيث تم إعادة توظيف 
البيانات الخاصة بخطوط الطيران والبيانات الإدارية الحكومية من أجل تنميط وتقييم 
مخاطر الأمن للركاب (200365 «هتنآ). وعلى نحو مشابه. فلقد تم إعادة توظيف كاميرات 
الإشارات المرورية ورسوم الازدحام في لندن من أجل القيام بمهام تتعلق بالأمن: وذلك بدلاً 
من مراقبة الانتهاكات ال مرورية فحسب (20072 طنطءغ19 هد ءع12048). ومن الأمثلة 
التجارية على التحكم في الانسلال هو نظام الملاحة في السيارات المستأجرة حيث يتم إعادة 
توظيف هذا النظام من مساعدة السائقين على إيجاد طريقهم فحسب إلى مراقبة وفرض 
غرامة على هؤلاء الذين يقودون خارج المسار أو يخرجون من الولاية (2004 111156). 
فالتحكم في الانسلال يقوض بشكل منهجي الأسباب المنطقية وراء تقليص البيانات» في حين 
أن نشره يشكل تهديدات واضحة للحريات المدنية.ء حيث يكون جميع المواطنين. سواء 
الأبرياء أو المذنبين» خاضعين طراقبته وإجراءاته التأديبية. 
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وهناك مثال آخر على الاستخدام الثانوي للبيانات والذي ينتهك الحريات المدنية ألا 
وهو الحوكمة الاستباقية (التوقعية). وهناء يتم استخدام التحليلات التنبئية من أجل 
تقييم السلوكيات أو الأحداث المستقبلية المحتملة والتوجيه باتخاذ الإجراء المناسب. فمثل 
هذه الحوكمة الاسعاقبة عد بيمة من سماتك البقر العو خلال عدة من السنوات 
حيث يتم تنميط المسافرين من أجل المخاطر والتحقق الأمني وذلك قبل البدء في الرحلة 
(2004 صنطاءغة]1 24د ء12008). وبالمثلء تستخدم العديد من قوات الشرطة في الولايات 
المتحدة الأمريكية التحليلات التنبئية من أجل توقع موقع الجرائم المستقبلية أو من أجل 
توجيه ضباط الشرطة لزيادة دورياتهم في هذه المناطق (2013 1عو516). وعلى النحو ذاته. 
تستخدم بعض الشركات مثل هيوليت باكارد (2212310 غ]»11»971) التحليلات التنبئية من 
أجل تقييم ومعرفة مَنْ منّ الموظفين من المحتمل أن يغادر الشركة» ومن ثم التدخل بشكل 
استباقي من أجل تقليل نفقات استبدال الموظفين (2013 516861). وفي مثل هذه الحالات» 
فإن آثار البيانات الخاصة بالشخص تقوم بما هو أكثر من تتبع الأشخاصء إذ تقوم باستباق 
هؤلاء الأشخاص (2002 5641062). 

إن مثل هذه الأساليب من الحوكمة تفرض قضايا أخلاقية بسبب أنها توجه الاهتمام 
إلى مجموعات وأماكن معينة. وهي كذلك تسعى لراقبة السلوكيات التي ربما لن تحدث 
على الإطلاق. وخلال هذه العملية. كما تقوم بإعادة تشكيل كيف يكن للناس العمل من 
خلال الانضباط الذات (2006 6,نامءة11). وعلاوة على ذلك. فإن مثل هذه التحليلات 
التنبئية تعمل في غالب الأحيان على تفاقم التحامل والتمييزء وتعمل كذلك على تأسيس 
النبوءات المحققة لذاتها (التوجه نحو إشباع الذات) (2013 اعيوع51 :2006 غكنامءة11). 
ومن ثم فلقد ادعى 128 :2013) 2216): "إن البيانات في هذا المجال تكون أدائية: فتجميع 
أجزاء وبتات (5165) من البيانات في ملفات شخصية لمشتبه به في الإرهابء وإعادة تأسيس 
البيانات المجردة عند استهداف حياة واقعية سوف يكون لهما تأثير على إنتاج هذه الحياة, 
هذا الشخص.ء كمشتبه به بالإرهاب بالفعل". ومن ثم يتم وضع الفرد تحت بؤرة المراقبة 
وممارسات مراقبة الدولة. وجعله خاضعا لنتائج وتداعيات كونه مشتبها به بالإرهاب, على 
الرغم من عدم التيقن من هذا الاشتباه. وبعبارة أخرىء تتم معاملة الشخص بطريقة 
مختلفة من جرء التوقع بأنه ربما يكون شيئاً ماء في حين أنه ربما يُكن هذا الشيء أو 
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لاايكنه أو ربمايرتكب هذا الفعل أو لا يرتكبه. وفي حين أن النوايا وراء هذا العمل 
ربماتكون نوايا عظيمة وحسنة. إلا أن التوقع في هذه الحالة له تداعيات تتجاوز منع 
الأحداث المتوقعة (2006 غتتامء:112). وكما هو الحال مع الأشفكل الأخرى من التنميط. 
فإن الحوكمة التنبئية يتم توجيهها بشكل كبير من خلال خوارزميات الصندوق الأسود التي 
تعمل على بيانات ذات أصل غير معروفء وهي على وجه العموم منغلقة على حق الرجوع 
(النقد). فالحوكمة التنبئية كانت مثار القليل للغاية من الاهتمام النقدي أو المناقشات 
وذلك بما يتعلق بتأثيراتها. وعلى الرغم من ذلك تم تطويرها بفعالية من أجل استخدامها 
في الحكومات والشركات. 


أساليب الحوكمة والضوابط التقنية (0صهة ععءصهصى0© 6ه 210065 
ول كك 1.0 لهءذعه1مصسطءع1): 

بعيداً عن التحكم في الانسلال والتنميط التنبئي» فإن ثورة البيانات لها تأثيرات محتملة 
فيما يتعلق بتنظيم وتشغيل الحوكمة. وإذا وضعنا في الاعتبار الشبكة المتسعة لجمع 
البيانات» وقراراتها الدقيقة. فإن قلق الكثير من المعلقين ينبع من أن عصر ظهور البيانات 
الكبيرة يسبق عصر ظهور ما أصطلح على تسميته وصاية الأخ الأكبر (7عط]8:0 عذ8). وهذا 
يعني أننا في عصر أضحت فيه الدولة والمؤسسات تعرف وتتوقع الكثير جداً عن الأفراد من 
خلال مراقبة البيانات والتنميط التنبئي لدرجة أنهم يمتلكون السلطة لفرض أشكال قاسية 
وضارة من التحكم الانضباطي. 

وكما أشرنا إلى ذلك خلال هذا الفصلء فنحن نعيش وبدون شك في عصر الراقبة الزائدة 
بشكل مبالغ فيه. حيث أصبحت المراقبة أكثر اتصالاً من أي وقت مضىء وهي مدعومة من 
خلال تزايد ثقافة السيطرة التي ترغب في الأمنء والاستقرار وتقليل المخاطر (2007 705:آ). 
وهناء يتم تشريع نوع جديد من الحوكمة. وهو نوع يؤول فيه تنظيم جوانب معينة 
من الحياة اليومية إلى الأنظمة التقنية المملوءة بالتوكيل الثانوي (ع12008 لصه صنطاء)ك1 
71. فعلى سبيل امثالء فإن معرفة: ومعالجة وإدارة الانتهاكات المرورية تتم بشكل 
متزايد من خلال الأنظمة الآلية. والمسموح بها من خلال برنامج يقوم بمعالجة البيانات التي 
تتعلق بأرقام اللوحاتء والسرعة. وحق الوصولء وإحالة هذه البيانات إلى قواعد بيانات 


ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة, والبنى التحتية للبيانات, والنتائج المترتبة عنها م 


الفصل العاشر 


ا ملكية من أجل فرض غرامات أو خصم نقاط بشكل آي (ه2007 صتطءع عقا ممه عع1200). 
وعلى النقيض من الأشكال التقليدية من المراقبة التي تسعى إلى تشجيع الانضباط الذاني» 
فإن الأنظمة الآلية تقوم بإعادة تشكيل السلوك بشكل فاعل (220 صتطاء)ة] :1994 عنعنم 
1 ©120048). وفي مثل هذه الأنظمة. فإن آليات إنشاء البيانات وتنظيمها تعتبر مجالا 
مهماً للغاية من النظام, وذلك بدلاً من كونها جزءاً خارجاً عن النظام. فعلى سبيل المثاله 
بدلاً من أن يقوم عمال صناديق المحاسبة بإجراء الانضباط الذات لمعدل عملهم لأنهم ربما 
أو رمالا يعرفون أنه تتم مراقبتهم من خلال كاميرات المراقبة التلفزيونية ذات الدائرة 
المغلقة, فإن عمل مسح البضائع ومعالجة المدفوعات هي الوسائل التي يتم من خلالها 
مراقبة معدل العمل بشكل مستمر. وفي مثل هذه الأنظمة/ فإن المراقبة وآثار البيانات 
ا مرتبطة بهذه المراقبة أصبحت مستمرة: ومتغلغلة. ومواظبة. ومتفاعلة. مع سلوك الخاضع 
لها. ولكنها تقع خارج سيطرته (2012 «عاهن). 


إن البيانات التي تكونت بشكل آلي لا يستخدم جميعها من أجل تشريع الإدارة الآلية, 
ولكن هذا هو الاتجاه السائد بشكل متزايد. وخاصة للأنظمة عالية التنظيم. وعلاوة على 
ذلكء فإن الأساليب الجديدة من التحكم. إلى الآنء لا يتم السماح بها بالطريقة الصارمة 
التي توقعتها رؤية جورج أورويل (01711© 660186) في روايته "الأخ الأكبر". فهذه 
الأماليب عادية وروتينية ومغرية وتشجع المواطنين على أن يشاركوا بفعالية وبتلقائية 
في ممارساتها (2012 تعطهن :2011 ع0008آ1 له ستطء )ق1). لوي لذلكء. فإنه وكما 
ذكر (2007) 501070: فإن البيانات الكبيرة لا تتعلق بشكل كبير بمباشرة رؤية جورج 
أورويل ولكنها ترتبط بشكل أكبر برؤية كافكا (12282) كونها تطرح قضايا عن الإجراءات 
الواجب اتخاذها فيما يتعلق باللامبالاة, الأخطاءء الانتهاكات, الإحباطء نقص الشفافية, 
والاستعانة أكثر مما تطرحه عن التسلط والاستبداد. وعلى النقيض من ذلكء فبالنسبة ما 
قاله (2013) :1806115804 فإن المجاز الأساسي في البيانات الكبيرة وا مراقبة ليس الرؤية 
الكلية ولكن بالأحرى هو التسليم فبدلاً من أن يكون الفرد خاضعاً على نحو صرف لرقابة 
انتهاكية, يُسلم الناس بحماس ببياناتهم من خلال وسائل التواصل الاجتماعيء أو من خلال 
الانضمام في برامج بطاقات الولاء... إلخ. وبغض النظر عن الصياغة التصورية للعملية, 
فمن الواضح أن هذه الأنظمة الجديدة لها تأثيرات فيما يتعلق بالسلطة والسيطرة. وتقوم 
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بتشكيا التجارب والفرص الحياتية بطريقة مختلفة, وأن دور البيانات ومراقبة البيانات 8 
مثل هذه الأنظمة يتطلب اهتماما نقديا إضافيا. 


إن من الطرق التي يتم من خلالها تحويل الحوكمة من قبل التقنيات التي تدعمها 
البيانات أن نجعل الحوكمة أكثر تكنوقراطية بطبيعتها (معتمدة على التقنية بشكل كلي). 
فعلى سبيل المثالء فإن النزعة تجاه إدارة وتنظيم المدن من خلال أنظمة ال معلومات 
والأنظمة التحليلية تعزز الأسلوب التكنوقراطي للحوكمة المدنية التي تفترض أنه من 
ا ممكن قياس ومراقبة جميع المجالات المدينة ومعاملة هذه المجالات على أنها مشاكل فنية 
يمكن التعامل معها ومجابهتها من خلال الحلول الفنية (2014 «نطاء]1؟1). وهي توضح ما 
أطلق عليه (2013) «:2126 مصطلح "العقلانية الأدائية". وما أطلق عليه (2/1070207 
3) "مقاربة الحلول التقنية" حيث ممكن تجزتة المواقف الاجتماعية ال معقدة إلى مشاكل 
محددة بشكل دقيق يمكن حلها أو البحث عن أفضل الحلول لها من خلال الحوسبة. 
ومرة أخرى, فإن هذا يعد تجسيداً للبيانات الكبيرة. حيث يمكنها أن توفر إجابات لجميع 
المشاكل (2013 3186]»65). ومن خلال التقاط وتمثيل الظواهر كبيانات بشكل آني أو 
لحظيء يصبح من الممكن من الناحية الظاهرية تخطيط. وفهم, وإدارة. وإصلاح ال موقف 
أو المشكلة حال حدوثها. وقد أوضح (2013) 111111 أن "تفكير المدينة الذكية" ينم عن 
وجهة نظر تكنوقراطية بأن المدينة هي شيء يتعين علينا فهمه بالتفصيل كار محرك أو 
محطة الطاقة النووية وذلك في حال كان لدينا بيانات كافية فقط. وأنه تبعاً لذلك سيمكننا 
السيطرة على هذه الممدينة من خلال القوة الغاشمة للعلم والهندسة. وفي الواقع, فقد اقترح 
(2013) صعغ21 أن تحضر البيانات الكبيرة يعاني من تراكم البيانات» وهو افتراض أن جميع 
التدفقات والأنشطة الهادفة يممكن الإحساس بها وقياسها. وداخل مثل هذا التفكير هناك 
افتراض واضح في الغالب وهو أن الكون تشكل من قبل المعايير القابلة للمعرفة والقابلة 
للتحديد والتي تؤكد لنا أنه لو كان بإمكاننا قياس جميع هذه المعاييرء فسوف نكون قادرين 
على التنبق والاستجابة بتمكن تام وفقاً لذلك (2012 16او514). وعلى الرغم من ذلكء لن 
يكون بمقدور الحلول التقنية بذاتها حل المشاكل الهيكلية المتأصلة في المدن لأن هذه الحلول 
لا تتعامل مع أسباب تأصل تلك المشاكل. ولكن بدلاً من ذلك, فإن هذه الحلول تمكن فقط 
من إدارة مظاهر تلك المشاكل بش كل أكثر فعالية. وفي حين أن تقنيات المدن الذكية مثل 
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أساليب التحليل اللحظية والآنية يتم الدفع بها كوصفة للتعامل مع جميع قضايا الحوكمة 
ال ممدنية, إلا أن هذه التقنيات في الغالب الأعم تداري الشقوق بدلا من إصلاحهاء إلا إذا 
واكب هذه التقنيات مجموعة أخرى من السياسات (2014 صنطء:1؟1). وممكن أن ينطبق 
الأمر نفسه على الطرق التكنوقراطية المطبقة في بعض المجالات الأخرىء فأساليب الحوكمة 
التي تقودها البيانات تضمن بالفعل تنفيذ إستراتيجيات مدعومة بالأسانيد ولكن يجب أن 
تكون مقترنة بالسياقء ومرنةء ومستهدفة بشكل ملائم, ولا يتم إدارتها ببساطة من خلال 

الأرقام والخوارزميات. 

ويتزامن مع ذلك الانتقاد القائل أن الحوكمة أصبحت مبنية على معرفة تامة وتكنوقراطية 
مفرطة ومع الخوف من أن يتم الاستيلاء عليها وتشكيلها بشكل صريح من قبل مصالح 
الشركات من أجل تحقيق مكاسب شخصية. وبالعودة إلى المثال المتعلق ببرنامج المدينة 
الذكية ومثال الحوكمة البلدية» وكما أشرنا إلى ذلك في الفصل السابع: فإن عدداً من أكبر 
شركات خدمات البرامج والأجهزة يسعى بشكل فعال إلى التعاقد من الباطن على مجالات 
من الإدارة المدنية وأن تجعل من بضاعتهم جزءًا لا يتجزأ وذات دور جوهري في كيفية 

مراقبة وتنظيم العديد من مجالات الحياة في المدينة (2013 20ع101725' :2014 صن 19). 

إن الهاجس والقلق النابع من خصخصة الإدارة المدنية ذو ثلاثة أوجه (2014 صناء]12): 

٠‏ أولاً: أنه يعزز بشكل فعال الاقتصاد السياسي للليبرالية الجديدة والتحول نحو اقتصاد 
السوق في القطاع العام حيث يتم إدارة وظائف المدينة من أجل تحقيق الربح 
الخاص (2008 205ه1101[1). 

٠‏ ثانياً: أنه يؤسس للقيد التقني الذي يجعل المدن مدينة وممنونة بالفضل بمنصات ومزودي 
خدمات تقنية معينة خلال مدة زمنية طويلة, مما يخلق مواقف احتكارية (111112013). 
والخطر في هذه الحالة يكمن في تأسيس تبعية للمسار المؤسسي مما لا يمكن إلغاؤه أو 
التحول عنه بسهولة (2012 5عغة82). 

٠‏ ثالثا: أنه يؤدي إلى حلول مغلفة أساسها "نظام واحد مناسب لجميع المدن الذكية" والتي 
لا تضع في اعتبارها إلا بشكل ضثيل للغاية خصوصية وتفرد الأماكن, والناس, والثقافات» 
وتقيد إدارة المدينة على أسلوب تكنوقراطي ذي رؤية ضيقة للحوكمة (2013 20ء107755). 
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المخاوف الأخلاقية. والسياسية, والاجتماعية» والقانونية 


وإذا ما أستحضرنا الواقع, فإن شركة 18384 في الوقت الحالي منتجاً يسمى "مركز عمليات 
6 الذي" الذي يجمع العديد من الأنظمة التي تم تصميمها لمدينة ريو دي جانيرو في 
منتج واحد ممكن تطبيقه على أي مدينة (2012 1ععدذة. انظر الفصل السابع). ولا يعني 
هذا أن نقول إن القيود التي تفرضها الشركات أمر حتميء» ولكن من الواضح أن ذلك يمثل 
رغبة عدد من أكبر الشركات العاملة في هذا المجال. وبامثل» يتم استهداف أشكال أخرى 
من الحوكمة بشكل متزايد من خلال الشركات التي تسعى إلى إيجاد أسواق للحلول التقنية. 
ومرة أخرىء فإن تداعيات مثل هذه الأشكال من الحوكمة تتطلب الكثير من التدقيق. 


الخاتمة: 

ناقش هذا الفصل التداعيات الأخلاقية, والاجتماعية, والسياسية. والقانونية للتغييرات 
التي تحدث من جراء تكوين البيانات ودمج البيانات واستخدام البيانات. ومن الواضح 
أنه في حين أن مثل هذه ال ممارسات لها فوائد بالنسبة للحكومات والشركات والمواطنين» 
إلا أنها في الوقت نفسه لها تداعيات سلبية وتمييزية. وإذا وضعنا في الاعتبار السرعة التي 
يتغير بها مشهد البيانات» فإن مواكبة التطورات وتحديد الآثار المحتملة لهذه التطورات» 
ودراسة ردود الفعل الاجتماعية والقانونية المناسبة يعتبر تحديًا هائلاً. وفي الواقع, هناك 
الكثير من الأسئلة الأساسية المعيارية التي تنطلب دراسة تأملية والتي تتعلق بمن يمكنه 
تكوين مجموعات البيانات والوصول إليها ومشاركتها وتحليلها. ولأي غرض وفي أي سياق 
وتحت أي معوقات أو قيود (673 :2012 0235010:4 لطة 4تزهط). إن الحاجة إلى إجابات 
بمثل هذه الأسئلة أمر ملح. وذلك إذا وضعنا في الاعتبار المدى والتأثيرات المترتبة على 
مراقبة البيانات وانتهاك الخصوصية والأمن غير المحكم للبيانات» والتأثيرات الضارة للفرز 
الاجتماعي والاستبعاد. والطبيعة والأساليب المتغيرة للحوكمة. فحتى لو كانت الاستجابة 
سريعة ومبالغ فيهاء فإن الإجابات المترتبة ستكون متنوعة. حيث إن العديد من أصحاب 
ا لمصلحة يسعون وراء إستراتيجيات بديلة من أجل التعامل مع المخاوف العديدة. بحسب ما 
يتضح من خلال المناهج المقترحة لتفتت وانتهاكات الخصوصية. ونتيجة لذلك: يمكن للمرء 
أن يتوقع الكثير من المناقشات في السنوات القادمة فيما يتعلق بإدارة العناصر العديدة 
في ثورة البيانات. وعلى وجه الخصوص. وكما ناقشنا في الفصل الثاني» فإنه من المحتمل أن 
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يوضع عمل سماسرة البيانات تحت التدقيق المتزايد سواء من جانب الحكومة أو المواطنين. 

ومن منظور أكاديميء من المهم للغاية أن يضطلع العلماء بدور فاعل في استقصاء ودراسة 
القضايا القانونية والسياسية والاجتماعية والأخلاقية التي تنشاً نتيجة لثورة البيانات» مع 
التتبع والإسهام في المناقشات العديدة ا لمستمرة. يحتاج مثل هذا العمل إلى أن يشتمل من 
جانب على دراسات حالة تجريبية مفصلة توثق التأثيرات المادية والاستطرادية الناتجة عن 
كيفية توظيف البيانات» ومن جانب آخر على البحوث والرسائل المعيارية والشاملة التي 
تحدد تأثيرات تجميع العديد من البيانات والطرق البديلة الممكنة. وحتى هذه اللحظة, 
فإن معظم الإسهامات كهذا الفصل والأعمال التي يناقشها تكونت من الجانب الأخير مع 
فعؤة القليل دا فق الدراسات الفسريبية غان بعضن الأنظمة التمدراعية الفيية المحددة 
ونتائج هذه الدراسات. إن مثل هذه الدراسات مهمة للغاية لأنها تكشف الطرق ال ملموسة 
التي تم من خلالها تقديم مبررات لتجميع البيانات, وكذلك المهام التي يتم ممارستها وكيف 
يتم قبولهاء وإعادة تنقيحهاء ومقاومتهاء وإفسادهاء وانتهاكها من قبل المجتمعات. وهذه 
الدراسات توفر أيضا قاعدة أدلة يتم من خلالها تصور كيف بممكن إعادة تأطير مثل هذه 
الأنظمة أو إعادة تحديد الغرض منها. 
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الفصل الحادي عشر: فهم ثورة البيانات 


(7011110ع1 12262 عطا أه عمصءد وسكله831) 


ناقش هذا الكتاب قضية أنه يتعين أن تكون هناك حاجة إلى تعاط أكثر نقدية وفلسفية 
مع البيانات وآن قورة البيانات ما زالث قائمة فى الوقت الراهن. وفيما يفعلق بالأمر الأول: 
ادعى البعض أن البيانات تمثل عناصر أساسية لإنتاج المعرفة. ومع ذلكء فحتى الوقت 
الراهن لم تحظ الصياغة الوجودية للبيانات والمجاميع المحيطة بإنتاج البيانات واستخدامها 
بالاهتمام الكافي. وبدلاً من ذلكء فإن التركيز كان منهجياً بصورة أكبر فيما يتعلق بتكوين 
البيانات» أو أن التركيز كان على الأشكال الاشتقاقية للمعلومات والمعارف. وفيما يتعلق 
بالأمر الثاني ادعى البعض أن تدرج البيانات الصغيرة في البنى التحتية للبيانات وإتاحة 
الوصول للبيانات التي كان الوصول إليها محدوداً في السابقء وظاهرة البيانات الكبيرة 
تدمر الابتكارات ولا تدعمها أو تحافظ عليهاء فهي تغير طبيعة البيانات من حيث حجم 
هذه البيانات. وسرعتهاء وشموليتهاء وعلائقيتها ودلاليتها. ومرونتها وتوسعهاء وتنوعهاء 
وانفتاحها وتبادليتها. وهي السبب في ظهور مجاميع بيانات جديدة وطرق جديدة لفهم 
العام الذي نعيش فيه. إن التأثيرات التدميرية لثورة البيانات لها تداعيات هائلة على 
الحكومات والشركات والمجتمع المدني وذلك من خلال إنشائها لمعارف وممارسات جديدة 
يمكن استخدامها من أجل إعادة صياغة كيف يمكن أن يتم حكم الناس وكيف يمكن أن 
تتم إدارة المنظماتء وكيف يكن أن تتم زيادة القيمة والفائدة» وكيف يكن أن يتم تكوين 
رأس المالء وكيف يمكن أن يتم تحسين الأماكن» وكيف يكن أن تتم إعادة تخطيط وممارسة 
العلم. وهي أيضًا أثارت العديد من التحديات وطرحت الكثير من الأسئلة» ومكنت لوسائل 
أكثر شيوعاً فيما يتعلق بمراقبة البيانات» وتقويض الخصوصية, وتنميط الأشخاص والأماكن 
والفرز الاجتماعي. ومهدت لسن أشكال جديدة من الحوكمة. فهذا الفصل الأخير يحدد 
خطة طريق دلالية من أجل إدراك وفهم البيانات وثورة البيانات وذلك بالنظر إلى الفجوات 
الحالية في الفكر المفاهيمي والمعرفة. ويشير هذا الفصل إلى أن مثل هذا الفهم بحاجة 
إلى أن يحدث بطريقتين: الأولى» من خلال التفكير الفلسفي الشامل والتحليل النقدي 
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الفصل الحادي عشر 


والمفاهيمي. والثانية. من خلال البحوث التجريبية المفصلة التي تتعلق بأصلء وتشكيلء 
ووظيفية وتطور مجاميع البيانات. 


فهم البيانات وثورة البيانات (166701102 102142 عط مده 12262 عوسنل سهد عجن ): 

إذا وضعنا في الاعتبار فائدة وقيمة البيانات. فهناك حاجة ملحة للنظر إليهم من وجهة 
النظر الفلسفية والمفاهيمية. فالفلسفة. كما ادعى (1921) 12ع]11718625. هي التوضيح 
المنطقي للفكرء فكل مدرسة من مدارس الفكر تُحَذُ نظاماً للأفكار ومنظوراً لفهم العام. 
وبمصطلح عام تتشكل كل مدرسة وتختلف عن المدارس الأخرى من خلال أربعة مكونات 
-الوجودية ((#وع10هغم©). والمعرفية (#روع10مدهئؤو1م8). والأيدلوجية (روم1امعل1), 
والمنهجية ((216000108) - وهذه المكونات هي التي تحدد معاييرها. فالوجودية هي 
مجموعة من المعتقدات التي تتعلق بطبيعة الوجود. وهي تهتم بما هو موجود وما يمكن 
ملاحظته ومعرفته. وبالنسبة للبيانات, فالوجودية تتعلق بماهية البيانات. ما الطبيعة 
الأساسية للبيانات؟ أما المعرفية فهي تتعلق بكيفية استخلاص المعرفة أو الوصول إليهاء 
وهي الافتراضات عن كيف هكننا معرفة العام بمعنى كيف أصبح بإمكاننا معرفة البيانات؟ 
وهي أيضًا تتعلق بكيفية حشد البيانات في ممارسة التعلم. أما الأيدلوجية فهي تتعلق 
بالسياسات الضمنية والغرض من إنتاج المعرفة, والمدى الذي يسعى من خلاله المنهج لكي 
يكون محايداً بمعنى أن يكون موضوعيًا وغير تقويميء أو المدى الذي يسعى من خلاله 
المنهج بفعالية للتدخل وتغيير العالم. وحيث ذلكء ينطوي تحت مفهوم الأيدولوجية العديد 
من الأسئلة مثل هل البيانات سابقة للحقيقة؟ وهل هي سابقة للتحليل وبلاغية؟ أو هل 
البيانات اجتماعية أم سياسية؟ وهل تمت صياغة هذه البيانات بفعالية؟ أما المنهجية 
فهي مجموعة الإجراءات المستخدمة من أجل تفعيل سؤال أو نظرية ضمن الافتراضات 
الوجودية أو المعرفية للفلس فة الإجمالية للبحث. وهي تشكل اختيار الأساليب التي يتم 
من خلالها تكوين وتحليل البيانات» فالمنهجية والأساليب مرتبطان بشكل وثيقء ولكن ما 
طبيعة هذه العلاقة بينهما؟ 

لقد شرع الفصل الأول في تقديم إجابات أولية عن هذه الأسئلة وقدم أيضًا صياغة لفهم 
البيانات من منظور فلس في مكن من فصل هذه البيانات عن كونها مجرد "مواد خام" 
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فهم ثورة البيانات 


للمعلومات وا معارف. فالبعض ادعى أن البيانات اجتماعية ومادية» وأن البيانات لا تمثل 
العالم فحسب. ولكنها تنتج هذا العام بشكل فعال. وادعى البعض أيضًا أن البيانات لا توجد 
بشكل مستقل عن الأفكارء والأساليبء والتقنيات, والناس» والسياقات التي تنتج» وتعالج» 
وتديرء وتحللء وتخزن هذه البيانات. وفي الواقع: يتم تنظيم البيانات وتخزينها في قواعد 
البيانات والبنى التحتية للبيانات التي تشكل لب المجاميع الاجتماعية الفنية المعقدة. وكما 
تم الإشارة إليه بالتفصيل في الفصل الأول» تشتمل هذه الأنظمة على أنظمة الفكرء وأشكال 
المعرفة والتمويلء والاقتصاد السياسيء وأنماط الحاكمية. والتشريعات. والماديات» والبنى 
التحتية: وا ممارسات. والمنظمات والمؤسسات. والذاتيات وا مجتمعات. والأماكن والأسواق» 
وكل نظام من هذه الأنظمة يشتمل على عناصر عديدة (انظر الجدول " - .)١‏ فهذه 
العناصر تعمل سويا بطرق متعددة, واتفاقية وارتباطية وذلك من أجل الإنتاج الاستطرادي 
وامادي مجاميع البيانات (انظر الشكل " - .)١‏ لقد تم عبر هذا الكتاب مناقشة العديد من 
هذه المجاميع مثل البنى التحتية البحثية, وا محفوظات الوطنية» والبنى التحتية السيبرانية, 
ومشروعات البيانات المفتوحة. وسماسرة البيانات, وأنظمة البيانات الحكومية, وأنظمة 
الأعمال. وكل واحدة من هذه المجاميع: بالرغم من أنها تتشارك في قواسم مشتركة. إلا أنها 
تتطور وتعمل بطرق مختلفة» وهي تتكون من مجموعة من الأنظمة والعناصر التي تتوسع 
بشكل مختلف (على سبيل المثال من المنظمات. والماديات المحلية. إلى الفرق المنتشرة, 
والقوانين الوطنيةء وفوق الوطنية إلى الأمواق العالمية) ولكنها على الرغم من ذلك مرتبطة 
داخل كوكبة فريدة. 

إن مثل هذه الصياغة تمكننا من جهة من التفكير في إنتاج البيانات وكيف يمكن صياغة 
هذه البيانات بأشكال متعددة من النواحي الفنية, والسياسية. والاقتصادية, والأخلاقية, 
والمكانية» والزمانية» وصياغة استخدامات هذه البيانات والعمل الذي تقوم به في العالم, 
وتمكننا من الجهة الأخرى, من توجيه البحوث التجريبية التي تتعلق بمجاميع البيانات 
(انظر الجزء التالي). وهيء على الرغم من ذلكء, مجرد مجموعة واحدة من الطرق المحتملة 
لفهم البيانات» ومما لا شك فيه أنه بمرور الوقت سيتمكن العلماء من إنتاج مجموعة 
من اللناظير التي يمكننا من خلالها فهم البيانات. إن تنوع وجهات النظر سوف يؤسس 
لعناصر تكميلية مثمرة للأفكار الجديدة ووجهات النظر المفاهيمية من أجل توجيه البحوث 
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التجريبية. وربما تشتمل هذه على تنظير البيانات من خلال منظار تأسيسي (بنيوي) أكبر 
يركز على دور هذه البيانات في تشغيل الرأسمالية المتأخرة» أو يستفيد من مفاهيم ما بعد 
البنيوية لدولوز (أحد أهم الفلاسفة الفرنسيين في النصف الثاني من القرن العشرين) التي 
تتعلق بأساليب الحوكمة الجذمورية (الجذمور: مفاهيم تتوزع على شبكة. بحيث تلتقي 
مع بعضها دون اشتراط اللزوم)» أو الانتقادات النسائية ما بعد الاستعمار للنوع الاجتماعي 
والإنتاج المْسَيّس وتوظيف البيانات. وبغض النظر عن المنظور, فالمطلوب هو تفكير عميق, 
وحريص ونقدي مع تنظير العمل من خلال دراسات الحالة التجريبية. 

إننا لسنا بحاجة إلى استكشاف الصياغات المفاهيمية للبيانات فحسب. ولكننا بحاجة, 
كما ناقشنا في الفصل الثامنء إلى دراسة كيف تطرح ثورة البيانات بعض التحديات أمام 
الفلسفات الحالية للعلوم. فالبيانات الكبيرة وتحليلات البيانات توفرء على وجه الخصوصء. 
إمكانية ظهور نموذج علمي جديد. أي نهج معرفي جديد يتميز بكثافة البيانات ويتسم 
بالاستكشافية بطبيعته وذلك من أجل تطوير النظرية العلمية. فا محاولات الأولية للتفكير 
فيما يمكن أن يعنيه مثل هذا التحول النموذجي كانت في غالب الأحيان مرتبكة ومضللة, 
وتعزز شكلاً من أشكال التجريبية التي يجدها الكثير من العلماء إبعادية وخطوة إلى الخلف 
وليست خطوة إلى الأمام. ويتعين استبدال هذا بمنظور أكثر فعالية لما يمكن أن يتكون 
منه العلم المساق بالبيانات من حيث معتقداته الفلسفية والمنهجية. لقد بدأ مثل هذا 
التفكير بالكاد ومع ذلك فهناك حاجة ملحة إليه من أجل مواكبة إيقاع التغير التقني ونشر 
المنهجيات اللمخصصة والبراجماتية (الواقعية). وكذلك من أجل استبدال الأشكال التجريبية 
الضعيفة المنتشرة. فالتحول النموذجي أقل احتمالية في العلوم الإنسانية والاجتماعية, ولكن 
على الرغم من البيانات الكبيرة, فإن البيانات المفتوحة والبنى التحتية للبيانات توفر منهجيات 
وطرق جديدة للقضايا الاجتماعية. والثقافية» والسياسية, والاقتصادية» والتاريخية. فالفصل 
الثامن استعرض خطة تفصيلية بالمزايا والانتقادات النسبية المتعلقة بالعلوم الإنسانية 
الرقمية والعلوم الاجتماعية الحسابية التي يتم تطويرهاء ولكن هناك حاجة ملحة لمناقشات 
كاملة وصريحة من شأنها استخراج النتائج من التحول ال معرفي في الفكر والممارسة» ويجب أن 
تقوم مثل هذه المناقشات أيضًا بتقييم دور ومزايا دراسات البيانات الصغيرة» وكذلك المناهج 
الهجينة التي تمزج أساليب ووسائل البيانات الصغيرة والبيانات الكبيرة. 
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ومثل هذا التفكير يجب أن يواكبه تفكير آخرء موجه بشكل أكبر تجاه ا معيارية في 
تكوين واستخدامات البيانات» وإنشاء وتشغيل مجاميع البيانات. وكما ناقشنا في الفصل 
العاشرء تطرح ثورة البيانات عدداً من القضايا الشائكة وذلك فيما يتعلق بالمدى الذي يتم 
على أساسه التقاط الحياة اليومية في مجاميع البيانات» وكيف أن بنية البيانات للناس تفوق 
وتضع قيوداً على حياتهم ب< بجميع أنواع الطرق غير المتوقعة. فعلى سبيل المثال. هل يجب 
أن يتحلى الناس بالمقدرة 5 الوصول إلى جميع البيانات المتعلقة بهم وأن يكون لديهم 
الحق في تصحيح والاعتراض على هذه البيانات» أو تحليلات البيانات أو التنميط؟ وإلى أي 
مدى يجب أن يكون الناس قادرين على ممارسة الحق في أن يتم نسيانهم؟ وما هي الطرق 
التي يمكن من خلالها إخضاع سماسرة البيانات لرقابة وتنظيم مستقلينء وخاصة عندما 
تكون بياناتهم وخوارزمياتهم تؤثر في الفرص الحياتية للناس؟ وما هو مدى تأمين الأنواع 
المختلفة من البيانات ؟ وما العقوبات المحتملة على انتهاكات هذا التأمين؟ وما الحدود 
المشروعة للحكومات في تجميع ودمج البيانات عن مواطني هذه الحكومات؟ وإلى أي مدى 
يمكن إشراك المؤسسات في أعمال الحكومات وأنظمة الحوكمة؟ فهذه القضايا تتعلق مماهية 
المجتمع المرغوب فيه في عصر وفرة البيانات» والإجابات عن هذه الأسئلة لها تداعيات 
وخاصة فيما يتعلق بإمكانية إعادة تصور وإعادة تهيئة مجاميع البيانات» وهذا يشمل 
الأشفكال الجديدة من الحوكمة والتنظيم. فالعلماء القانونيون بدئوا بالفعل في التفكير في 
بعض القضايا مثل نتائج خصوصية البيانات الكبيرةء وبدؤوا كذلك في تقديم طرق بديلة 
للتعامل مع أكثر الآثار ضرراًء ولكن من الواضح أن مثل هذه القضايا بعيدة كل البعد عن 
الحلء وأنها ستكون محل تركيز المناقشات المتطورة والصراعات التشريعية. وأن هناك حاجة 
ملحة للإسهام في هذا الحوار الفعال والصريح والمستمر. 

ويتزامن مع تطوير فهم مفاهيمي ومعياري أعمق وأفضل للبيانات» الحاجة إلى توفير 
وجهات نظر شاملة نقدية وكلية عن البنى التحتية للبيانات والبيانات المفتوحة والبيانات 
الكبيرة وتداعياتهم. لقد قدم هذا الكتاب تخليلا شاملا بدلا من طرح فرضية تستند إلى 
بحث تجريبي شاملء واستفاد من الكتابات الأكادمية والإعلامية والصناعية. فهذا النهج ذو 
فائدة لأنه يجمع الأفكار والملاحظات 50 مصادر متعددة وذلك من أجل تقديم نظرة 
أعم وأشمل عن المشهد المنتشر, مما يساعد على رسم وتصور الديناميكيات الأكبر ودراسة 
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التأثيرات المحتملة لها. ومع ذلكء وعلى الرغم مما سبقء فإن المنظور العام الصعب. 
والتأملي: والشامل ثثورة البيانات لا يزال ضعيفاً في الواقع العملي. وبدلاً من ذلك فهناك 
مجموعة من الكتب وعلى وجه الخصوص في مجالات الإدارة, والأعمالء والمجالات التقنية 
تعمل بشكل كبير على دعم البيانات ولكنها تفتقر للمنظور النقدي. وعلى النقيض من 
ذلكء فا مطلوب تقارير متعددة الاختصاصات ومعقدة في تفكيرها. وفي حين أنه من المفيد 
دراسة ثورة البيانات من خلال منظور متعدد الاختصاصات والأوجه. إلا أن هذا المنظور 
مقيد بشكل جذري وذلك بالنظر إلى الأجندة الشاملة والآثار المترتبة. وعلى نحو مشابه. فإن 
المفهوم القائل بأن ثورة البيانات تنتج البيانات التي يمكن تفسيرها خارج سياقها أو المعارف 
خارج مجالها المخصص بحاجة إلى أن يتم إلغاؤه. وبدلا من ذلك. فمن الضروري الاستفادة 
07 الأفكار والمدارك عبر الإختصاصات. حيث يعمل العلماء الذين يتمتعون بخبرات مختلفة 
نا من أجل تقديم صورة أكثر موا وفموم (2012 تع م منتا). 
وقتلاوة على ما سبقء فإن التحليلات أوجدت حاجة لكي نكون حريصين ألا ننزلق إلى 
الجدليات التافهة التي إما تحدد بشكل انفعالي حالة البيانات الكبيرة, والبيانات المفتوحة, 
والبعى اسع للماناكه أن توفر قدا مستحكما يشحب أكق نداتهيا سلبية: قاللوقت لا 
كوق إغا انيفا أد |أسودا أمعيدا أو سفاء إلا فيما ندرء وعلى النحو الذي تطرحه الجدليات 
الانفعالية. ويدلاً من ذلك يكين علينا أن تقو أن القظورات الحادقة اتفاقية: وارشاظية: 
وسياقية. وهي تنتشر بطرق فوضوية وأحياناً تناقضية وتباينية. وكما أشرنا إلى ذلك في 
الفصل التاسع.ء تعمل مجاميع البيانات في الغالب على كل من الإجبار والتحرير بشكل 
فوري ومتزامن» وأن مستهلي النافاك أغيانا يكونون هم منتجي البيانات» وأن الأنظمة 
تسعى إلى استنطاق المستخدمين بطرق عديدة. وعلى هذا النحوء فإن المجاميع غالبا ما 
تكون متشابكة ويتعين أن يتم فتحها وتفريغها بشكل حذر وذلك من أجل إظهار تدرجاتها 
الرمادية المتعددة. وعندما توجد تأثيرات تعمل بطرق مضرة وتمييزية» فنحن بحاجة إلى 
تحديد الاستجابات الاجتماعية والقانونية المناسبة التي تحمي الحقوق الفردية والجماعية, 
ولكنها لا ترفض الكل لعدم رضاها عن الجزء. 
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دراسة مجاميع البيانات (5ء2128اءو45 10268 وسنطءمهدء ودع ]1): 

هناك ضرورة ملحة لإجراء بحوث تجريبية مفصلة عن تكونء. وعملء وتعزيز مجاميع 
البيانات وذلك من أجل مواكبة وتعزيز التحليلات النقدية والمفاهيمية الأعم والأشمل. ففي 
الوقت الحاليء لدينا فهم متعمق قليل بكل من البناء الإجمالي لمجاميع البيانات وأجهزتها 
وعناصرها الفردية. ونتيجة لذلك. هناك حاجة ملحة لإجراء دراسات حالة تتتبع الترتيبات 
الفنية الاجتماعية لكافة ا مجاميع: مثل تجميعة بيانات لسمسار ما أو البنية التحتية لبيانات 
بحث ماء أو حركة البيانات المفتوحة في مدينة ماء أو التوثيق المفصل بلمجالات معينة من 
أحد المجاميع: مثل علم الاجتماع؛ والاقتصاد السياسي لمطوري البرمجيات (1121>2)05): 
ومنتديات العطل الأسبوعية لمجموعات الاختصاص (1(1565 1232).: أو مجتمعات ال ممارسة 
داخل قطاع ما في البيانات الكبيرة. وبشكل نموذجيء فإن مثل هذه الدراسات ستكون 
دراسات مقارنة بطبيعتهاء تقارن التكرارات في تجميعة ماء على سبيل المثالء عبر الأماكن أو 
البيئات» أو عبر أنواع مختلفة من التجميعة. ومن شأن مثل بحوث المقارنة هذه أن همكن 
من تحديد العموميات والخصوصياتء وكذلك الطرق الاتفاقية والارتباطية المتنوعة التي 
تتسع من خلالها التجميعة ليتم تشكيلها. 

وهناك طرق عديدة يمكن من خلالها تفعيل مثل هذه البحوث. وهي تشمل تحليلات 
البيانات» كما تمت مناقشته في الفصل السادسء وذلك من أجل تحديد تركيب تجميعة 
ما والارتباطات والعلاقات بين العناصر. وسيكون لثل هذا النهج فوائد عديدة وذلك من 
خلال استخدام قوة التنقيب عن البيانات والتعلم الآلي من أجل تحديد الأنماط داخل وعبر 
مجاميع كبيرة للبيانات» وكذلك من أجل تأسيس قوة نسبية للروابط. وهذا من شأنه أن 
برق كقبيرا وها ومقارنا للمجاميع وتشغيل هذه المجاميع. وعلى الرغم من ذلكء وفيما 
يتعلق بفهم السياقء والاتفاقية والارتباطية المتعلقة بتجميعة ما -التداخل المعقد للكائن 
ومحيطه - فإنه من المحتمل, ربما بشكل ساخرء أن مجموعة من المنهجيات الخاصة بالبيانات 
الصغيرة قد توفر قفرا إفراكياً تتويرياً دقيقاً. وتشتمل هذه المنهجيات. على سبيل امثال 
لا الحصرء على منهج علم الأصوا ل (وعذعه[هعصء0). ومنهج التفكيك (<مناء1تاقتمء»ء10): 
ومنهج الأعراق والثقافات (1165م8141208172) ومنهج مشاركة الملاحظ (غصهتتاءو © 
1 وهي تمثل مجموعة من ا منهجيات التي أيدت استخدامها في السابق 
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من أجل فهم البرامج (2011 20086 لصة صنطء؛؟1): والتخطيط (:2009 .21 © 120086 
2 21.6 »© صخطء101). وتسعى كل منهجية إلى أن تحدد وتفكك بشكل دقيق الظواهر 
الاجتماعية: وكما بينت العناصر الأحد عشر, فإن مجاميع البيانات تعتبر اجتماعية بشكل 
كلي. ومن خلال استخدامها كمجموعة. فإن الإنتاج المادي والاستطرادي المنتشر ملجاميع 
البيانات يمكن تجزثئته لأغراض علمية؛ مما يوفر ما أطلق عليه (2013) 28ه717 مصطلح 
"البيانات الكثيفة". أي الأفكار والقصص السياقية عن البيانات وإنتاج البيانات. 


إن علم الأصول يستخدم كثيراً من أجل تتبع الانتشار العرضي لنظام الأفكار أو لمجموعة 
من الأفعال عبر الأوقات والأزمانء وذلك بدلاً من إنتاج تأريخ غائي سليم (/©1ه2 
9). وهذا يوضح كيف أن المستقبل يبنى على الماضيء ولكنه لا يتحدد بالضرورة من 
خلاله بطرق سببية مسببيه بسيطة. وعلى هذا النحوء يتم توظيف علم الأصول من أجل 
الحل والفهم بشكل تاريخي للتكرارات المتناقضة والمتغايرة أحياناء والمعقدة: والمتعددة 
لأحد مجاميع البيانات, أو أحد عناصرها وكذلك الفهم للانتشار المتطور والقائم للأفكار 
والقرارات» والمعوقات, والأفعال, واللاعبين الذين أسهموا في تطور هذه المجاميع: جنباً إلى 
جنب مع النهايات ا مسدودة والإخفاقات الواضحة (1977 1012116). وعند فعل ذلك, 
فإن هذا يحدد نقاط التجمع حيث يحتشد الناس أو الأفكار سوياً ويتسببون في ظهور 
مجاميع جديدة: وكذلك الطرق ال معقدة والفوضوية التي تتطور من خلالها هذه المجاميع 
بعد ذلك. وفي حال ثورة البيانات» يمكن توظيف منهج علم الأصول من أجل تتبع تكوين 
وتطور البيانات المفتوحة والبنى التحتية للبيانات والبيانات الكبيرة بشكل أكثر عمومية, 
والتجسيد ال محدد لها. 

فعلى سبيل المثال؛ يمكن لشخص ما أن ينتج تأصيلاً مفصلاً لتطور حركة البيانات املفتوحة 
بتعبيرات عامة. من خلال تتبع ظهور اللاعبينء والمنظمات. ونماذج التمويلء والأفكار, 
والأحداث بمرور الوقت وعبر الزمنء والترابطات والتحالفات والخلافات بينهم: وتأثيراتهم 
على إعادة تشكيل مشهد البيانات من خلال إعادة تحديد السياسات التي تحيط بالحكومة 
التي أنتجتء. واحتفظتء وكشفت مثل هذه البيانات من أجل استخدامات أعم وأشمل. أو 
يمكن للشخص أن يشرع في تحديد أصل كيان فردي مثل مؤسسة المعرفة المفتوحة. وهي 
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مؤسسة غير ربحية تأسست ف العام 2004 في المملكة المتحدة» ونمت بسرعة لكي تصبح 
حركة دولية مؤثرة تطالب بالبيانات المفتوحة والحكومة المفتوحة. وهناء يمكن أن يسعى 
الفرد تجاه تتبع نشأة المنظمة, وتطور مهمتها وقيمها.ء وتطور البنى التحتية. والحوكمة, 
والتمويل: والأنشطة. والبرامج, والإصدارات, وانتشار تأثيرها وتفاعلاتها مع الهيئات الأخرى 
وهكذاء وذلك من أجل فهم الطريقة الاتفاقية والارتباطية لتوسعها وعملها على سبيل 
المثال» وكذلك موقعها الحالي وسلطتها ضمن حركة البيانات المفتوحة الأعم. 

إن إجراء تحليل علم الأصول عادة ما يصاحبه الاستفادة من التفكيك وهذه الطريقة من 
التحليل تجرد وتكشف ال معاني داخل النصوص ال مفهومة بشكل واسع مثل النصوص ال مكتوبة» 
والصورء والخرائط» والأحاديث. ومزيج من هذه الأشياء تشكل في العادة المحتوى للكتيبات 
وا مواقع الإلكترونية. فمن المفهوم أن النصوص هي الوسيط لكل من الرسائل الصريحة 
والضمنية» ومن خلال التفسير التشريحي للنص» يمكن فهم والكشف عن معان أعمق. ومن 
ناحية الجوهرء فإن التفكيك يبحث فيما يتجاوز الإشارات السطحية والقيم الاسمية لكي 
يواجه القراءات المسلم بها للنص وذلك من أجل الكشف عن المعاني المخفية بداخله أو ربط 
ا معاني المبسطة بشكل محكم (1989 112167 :2005 عتتتاءآء212 0ه سهحصن81). فالتفكيك 
هو قراءة نقدية تستخدم أساليب مثل استبدال المعاني أو القوة ا محتملة, أو تحديد نقاط 
التناقض أو التباين لأجل حل النصية البينية والتضمين داخل الماديات والسياقات الأعم 
والتفكير في وضعية المتحدث والجمهور المستهدف له (2005 عتتائآء21/2 220 مةسمستننا8). 
وكما أشرنا إلى ذلك بالتفصيل في الفصول الثاني والثالث والسابع. فإن البيانات المفتوحة 
فاليكى العضية لأبيانابة والبياقاك الكيرة هاهة اما بواانيا سميها أنقلءة شطابية قفن 
إلى إقناع الناس» والشركات, وا مؤسسات بممنطقها من أجل دعم وتبني والاستثمار في مبادثها 
ومنتجاتها. فالأنظمة الخطابية هذه ليست عالية ولكنها معقدة وفوضوية» فهي مزيج من 
ا مصالح المتعاونة والمتنافسة. ومن خلال استخدام التفكيكء فإن الأنظمة الخطابية لتجميعة 
ماأو عناصر معينة في هذه التجميعة. مثل الفئات العديدة في حركة البيانات المفتوحة أو 
شركات معينة تعمل على تعزيز حلول البيانات الكبيرة على القضايا امدنية: يمكن تجريدها 
وتفكيك رسالتها وتكوينهاء مما يكشف عن المعانيء والأيدولوجيات (المعتقدات). والسلطات 
الكامنة داخل تصميمها وعرضها. 
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وتوفر دراسات الأعراق والثقافات تحليلات شاملة وهائلة لمجتمعات الممارسة من 
خلال التوثيق التفصيلي لتنظيمهاء وعملهاء وثقافتهاء وقواها المحركة الداخلية وارتباطاتها 
الخارجية (2000 11620656). وعلى نحو نموذجي.ء يوظف المنهج الإثنوغرافي (وصف 
الأعراق والثقافات) مزيجاً من مراقبة المشاركين التي يتم القيام بها عبر فترة زمنية ممتدة, 
ومقابلات شخصية متعمقة مع مجموعة كبيرة من المستفيدين الداخليين والخارجيين. مع 
تعزيز كل ما سبق بأساليب أخرى مثل القراءات التفسيرية للوثائق والأدوات ذات الصلة 
مثل المواقع الإلكترونية» وتبادلات البريد الإلكترونيء وأماكن العمل... إلخ. ومن الناحية 
الجوهرية. يسعى علم دراسة الأعراق والثقافات إلى الفهم الدقيق للعام الحياتٍ لمجتمع 
ما - علاقاته الاجتماعية. وإيقاعاته المتواترة. ومعانيه الثقافية, وأنماط السلطة. واتخاذ 
القرار فيه. وطرق كينونته.... إلخ - من أجل فهم كيف تشكل هذا المجتمع وكيف ينمو 
بشكل مستمر (2007 0001 320 013125). ويذهب الباحث بعيدا مات تقديم 
وصف سطحي لتوثيق الطرق المعقدة التي تعمل من خلالها المجتمعات من خلال كونها 
متضمنة داخل العلاقات وال ممارسات التي يتم دراستها. ومن شأن دراسة الأعراق والثقافات 
مجاميع البيانات أن تقدم بعد ذلك أوصافا تفصيلية شاملة عن كيف تم تكوينها وكيف 
تعمل على أرض الواقع. فعلى سبيل المثالء فإن دراسة الأعراق والثقافات للؤسسة المعرفة 
المفتوحة سوف تتكون من باحث تم تضمينه داخل تلك ال منظمة. وهو يشارك في التخطيط 
للاجتماعات. والأنشطة. والفعاليات: ويراقب تفاعلات العمال ويجري مقابلات شخصية 
مع المستفيدين الأساسيين للحصول على مدارك مباشرة حول عمليات اللاعبون الأساسيون 
في حركة البيانات المفتوحة» وكيف يتم تأسيس وإدارة المكونات العديدة لمجاميع البيانات 
(بمعنى أنظمة الأفكار؛ والاقتصاد السياسي؛ وأنماط الحاكمية؛ والماديات؟ والبنى التحتية؛ 
إلخ) داخلها وعبرها. وعلى نحو مشابه. يمكن للفرد أن يجري دراسة الأعراق والثقافات 
داخل بنية تحتية معينة للبيانات: أو على سمسار للبيانات» أو داخل شركة للبيانات الكبيرة, 
أو داخل أنواع معينة من الفعاليات مثل سباقات البرمجة أو المعارض وال مؤتمرات الصناعية, 
أو فرق البيانات الكبيرة داخل الحملات الانتخابية... إلخ. 


ويمكن أن يتم دعم مثل هذه الدارسات للأعراق والثقافات من خلال مشاركة 
الملاحظء. وهذا نوع من الدراسة الذاتية للأعراق والثقافات حيث يجري الباحث 
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دراسة مستدهة لارتباطاتهم وارتباطات الناس الآخرين بظاهرة أو ممارسة ما 
(2005 1/1016 :2007 0001 220 ع8طه2ن). وفيما يتعلق بثورة البيانات. من 
الممكن أن يتم مشاركة الملاحظين بحيث يكونون جزءاً من فريق يبني البنى التحتية 
للبيانات. أو يكونون أعضاءً في حركة البيانات المفتوحة» أو يعملون كعلماء للبيانات 
يوظفون البيانات الكبيرة من أجل معالجة قضية معينة... إلخ. فعوظيف طقل هنذا 
النهج يعتبر في الأصل تمرينًا للانعكاس الذاتيء وهو تدريب شخصي وغير موضوعي» 
عيك نض الاك جاهدا وبدقة بالغة لدراسة ممارساته وممارسات الآخرين 
ف محال ها هيت يكوق لاما أسالسيا فق هذا التجال:#الغائدة اللناسية ككل هذا 
ا منهج تتمثل في أن الباحث يدرك بشكل كامل ال مشهد المتنوع وا لمعقد من النواحي 
الاجتماعية. والسياسية. والاقتصادية والذي يعمل من خلاله هذا الباحث ويعتبر 
أحد المشاركين الفاعلين فيه ويتعرض للعمليات المتعددة الجارية. ويظل الانتقاد 
الأساسي ال موجه مثل هذا المنهج هو أنه من الممكن بدرجة كبيرة أن ينثني الباحث 
ويوضع في مكان ما بشكل شخصيء مما يفقده التمثيل العريضء ورها تتم الاستفادة 
من هذا المنهج بشكل أمثل إذا ما تم دمجه مع طرق أخرى توفر سياقا أعم وأشمل. 


إن هذه الطرق تمثل مجموعة جزئية من مجموعة من الطرق المحتملة لفهم مجاميع 
البيانات وعناصر هذه المجاميع: ومما لا شك فيه أن الكثير من هذه المناهج سوف يتم 
توظيفها من أجل إجراء بحوث تجريبية على طبيعة ثورة البيانات ال منتشرة, إذ يوفر كل 
منهج رؤى مختلفة. وفي الواقع: فإن المنهج الذي يستخدم طرقاً مختلطة تمزج بين الرؤى 
السياقية المتعمقة للدراسات النوعية التي تستهدف البيانات الصغيرة وبين الدارسات الأعم 
التي ترظن يلاك البباناك رما كون سملا مقيدا لاتباعه. وفي مثل هذه الدراسة, 

من ال ممكن استخدام تحليلات البيانات من أجل تقديم منظور شامل لمجاميع البيانات» أو 
الروابط أو التداخلات بين المجاميع: والتي يتم اتباعها بعد ذلك من خلال البحوث الأكثر 
تركبرا باستخدام الطرق التي تم تفصيلها من أجل توفير رؤى متعمقة للعلاقات والعمليات 
السارية داخل وبين هذه العناصر. أو من ال ممكن أن يكون هذا الموج مؤيجا كفيا غرفا 
فيما يتعلق بالصيغة. وذلك على النحو الذي تمت الإشارة إليه بالتفصيل في المناقشات بشأن 
علم البيانات في الفصل الثامن» حيث تم تبني التحليل التفسيري لتجميعة البيانات بشكل 
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أكبر من اختبار الفرضيات التقليدي من أجل تحديد أكثر العناصر الفاعلة ظهوراً. ويمكن 
أن يعمل هذا المنهج أيضًا بشكل عكسيء حيث يتم استخدام البحوث المتعمقة المركزة من 
أجل توجيه انتشار تحليلات البيانات عبر عينة أكبر بكثير. وفي كلتا الحالتين» فإن المرحلتين 
الأولى والثانية تعملان بتناغم بعضهما | مع بعض من أجل تعزيز المدارك والمعارف. ففي 
الحالة الأولى» يتم استخدام الصورة الأعم من أجل المساعدة في صياغة الفهم وتعميقه وقرنه 
بالسياقء أما في الحالة الثانية» فإن الفهم المتعمق يوفر الأساس لمحاولة تأسيس أو وضع 


أفكار ختامية: 

لا تزال ثورة البيانات في طورها التمهيديء ولكنها تنتشر بسرعة بالغة. فخلال عدد 
من السنوات لا يتجاوز أصابع اليد الواحدة: كان للبيانات ال مفتوحة والبيانات الكبيرة 
والبنى التحتية للبيانات تأثيرات كبيرة على مشهد البيانات. وتزامن هذا مع مناقشات 
صوتية حماسية تعلن عن التأثيرات الإيجابية الخطيرة لها. إن سرعة التطورات التي تحدث 
تعني أن التحليل النقدي الموسع. والمتعمق, والمدروس يجد صعوبة بالغة في مواكبة تلك 
التطورات. ومما لا شك فيه أنه خلال السنوات القليلة القادمة سيكون هناك فيضان 
حقيقي من مثل هذه الدراسات التي تسعى إلى توثيق طبيعة وآثار مجاميع البيانات 
الناشئة. وكما ادعى البعض خلال هذا الفصلء فهناك حاجة ملحة لهذه الدراسات. إن 
هذا العمل سوف يحدد من جانب الطرق المناسبة لفهم ثورة البيانات. من خلال كل 
من التفكير المفاهيمي والدراسات النقدية. وعلى الجانب الآخرء سيوفر بيئة لتفكير أكثر 
معيارية فيما يتعلق بكيفية تطور وتنظيم وإدارة مشهد البيانات. وفي الوقت الراهنء فإن 
الأخير يكون في الغالب تفاعلي ومفهومًا بشكل ضعيفء وتسيطر عليه المصالح المكتسبة. 
لقد سعى هذا الكتاب إلى تقديم تحليل أولي ومفاهيمي بشكل متوازنء. ونقدي وشامل 
والذي من الممكن أن يساعد على توجيه الدارسات التي تتبعه. ولوقت طويل للغاية, 
فإن البيانات وتكوين وعمل المجاميع التي تحيط بالبيانات قد تم الأخذ بها على أنها أمور 
مسلم بهاء في حين أن الاهتمام كان منصباً على المعلومات والمعارف المستقاة منهاء فالوقت 
قد حان لتدارك هذا الإهمال. 
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عطا مغ /911 حدم ذذا! أعننء112-5نآ عغط]ط' :تإدمغعهة8 5120017 عغط1' (2009) .[ ,#0مكصدظ 


1011 7و8 ,وك[ه80 ناماع صخ .مع 1تعصصطة دده عصامم 1825020 


0ه ,وعتطاصة2عمعع ,5ع11مأقلط :ؤاء طصطتتاه 4ه ععهام غط1" (2001) .01 بلمصصدآط ممه .[.1 ,معصعدظ 


.379-83 :19 ,ععهم5 0ه تإأع50 :0آ قصتصصدا2 220 غدع متم كصظ ,مكدع كل تأسمبين 4ه معترمعط) 


//نصاغط ,رلوؤأوتة عصنتلده) علم ماص ,روه [مصطءع] لمعقتامم هه بإتتمعط1" (2013) .0 باأعصعوظ 
-20 - تت تحط -حده اع تت ط_تاوع ذتكع :01-1 0آ//201307/حتامء.ووع:1م5.17010و51.ع00 مرتكصهلهء1201 


.(2013 أكتاعتتك 2 لوووععء2 1256) 01م تأكلتعطا 


4 املغهامه-مء :”عكلتا كاه10 معدل نوع تعل طتتعلمطط غقطرر ذ5ز منط1”“" (2012) .[ ,روعنلوظ 


عطط' ,ع كنخه ناته[ 224[ اللاعصم007 معم0 10125 عط 01 وستمقطة عطا صذ متاو غوعغخصممء 
/زعك امعطم دعل صذ/اعط. مناه زك.07//:صغط (8)2 ,نع تاه ملآ اتصتاتصصدهت 6ه لمعنه[ 


.(2013 تإتتقناطاع 6 0عووععع2 1256) /845916 تع نع اعتاته 


اع م5//:صاغط :212 21 ,اتاعصتصده0 521811 ,262 عنتاطنام تهنا وستصءم0' (2013) .[ روعلوظ 


.(2013 نأو طصسعامء5 18 4فووععء2 1256[) /022-عت[طتام-عصتمعم201321/05//0/كعلنا.عة.أعطد. امع 


تلاعت طتاتمد دعناتن عوصنلصهوؤومء0مت1ا :ونع امصدمن امه دعتكتن  )2007(‏ .121 وواخدظ 
خالا ,ع108اطصهن رووع:2 2111 .15[هاء122 لطنه رواءع85100 0ع825 أخدعوظ ,262 ماماتتم 


117210111 ,للك ,نطه8322 ,لك :2020201011203 ,1 ,نام ططه01 ,1.18 ردعدىتتقطاعحك ,.81 تواكد8 


23 1136111 عطأ 1ه و5عتاك اتتممطة (2012) الآ ,الدع 2011 0ه .© ,كلطنا9©120 .1/1 
.481-18 :214 روعامه1' لقععم5 22[1خنام[ لمعتستوطاط 


2 لم50 01 وعقستطامء5101 لتته 5ع15 عغطا عع غ004 2غه10' (2013) .>1].1 يستووظ 


اعاعتاته لح /صحامعع ل صذ/وزه /02337.015<محصادمط //:نصقغط 2  18)10(,‏ ورجملصه]/طااو طروت عمم 
.(2014 [إتتةتتطه[ 3 لعووعععة 6غ5د1) / 11617/48733752 
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2 5356 10262 طعنتهعوع1 وصتوعع؟]1 (2010) .21 ,110011210 لصة .8 ,عزمكهآ .لطا رعتهدةء8 ٠‏ 
.طام.ء5 1 ز/حامء.ع تعد ط.181707//:صاخط .8115601 0ه جملحه.آ ,1150 

2773-7 :(190)4 ,ععمعك5 كه #زإامهده[1ناط تواعك50 220 ,عتتكلنه ,ععمعكن 5" (1952) .28 زععكاءء8 ٠‏ 

:1015 ةع 510تمء 1181 ع دده :2.0 داء/13 صذ ل صه 01 ,220 ترع10م0ك50' (2007) .1 ,8111101035 220 .10 زتعع 8 ٠‏ 
لصغط./1217/5علتاءع:1ه.عصتاطاهموع 007.501 //:نصقغط ,(12)5 ,عسصتلم0 طعنتهعوع18 لمعنع10م 500 

2687 عط لحنة وعخحتطاعتة 621تع01 عتتكلتء تتدلنامه' (2013) .1 ,811110105 لطنة .([ ززعء8 ٠‏ 
47 :(300)4 راع ك50 220 عنتنطلنات ووتتمعط]' ,تغهل كه عكنا لهك هد 

5< 220011103 لوك50 11017 :اماع81 01 طتخلوءع11 عط]' (2006) ]ا نتععلصءظ ٠‏ 
“01 بتعتتداط توعآ8 رووع 21 وزوز ءكتمتا علهلا .لملععمظ لحنه داأععاته/1 

1ط /وع 1551 داع ذو 5/10 9717907.9173.01//:نصاغط ,12268 لعكلصاآ (2009) "1١‏ رعع.آ-وتعصمع8 ٠‏ 
.(2013 تإتقتتصد[ 30 لعووععء2 1256) لصغط 

5ع لأتمتمسصتط لمغتئتل عط غنامطاه وصستلصتطا بصعدط لمصطم 6ه تاصصطمء عط1"” (2011) .لآ رودعظ ٠‏ 
/علع تاه /حك طم دعل صذ/اعط.عصخطع ه تع تن لنه.017//:نصاغخط ,12 بعصتطع د18 عتتطلنت 
.(2012 تاعطمرءءء2آ 3 لفووعءعء2 56د1) /440470/تع نر 

,55 لاع ك5 0362 4لتتاط 10 تنا تدعا 5ع زواع كتصطنا ,18141 (2013) .[ ,أععساماء8 ٠‏ 
دع 7( لصه - هه ل -ع 1ط هه 0 -ئ 1ط //حتامء .كاعع 7اكحه 1ه ححطةم .100797 //نصاغط ‏ «إتتمتتصد[ 15 كاععء1ل1 
.(2014 تإتتمتتصه[ 16 لعووععء2 6أمد1) /كأمتأطع نك 110-022-5ناطا-0-جنا- تدع - دع 1 زواع تناح سلطا 

(2007) .6.8 راوء18 لحطة .ن) ,اأاعصطدككا ,.0آ ,وصتطاع1 ,.[ ,هطام.آ ,.ظ.آللا.آ ,تتنامعمعناء8 ٠‏ 
عط آه وعصتلعءء2:0 ,وعنكك طذ عكنا 4ه ععدم عط ته ,وصتلهةء5 ,هه م تصة ,طأوومدن"' 
.7301-6 :(104)17 ,وععسصعك5 كه تإتسعلوعى لمدم غدل 

2:77[ ارطء :1/121 1 رقنةه قتاع 5 ,”521121201 طذاءء ز21:0 أن اتتقمدد عط1" (2013) .لل ,دواعزظ ٠‏ 
11152125 -1ع521262110-اعء ز1:0م- ترك -211 122و /5 01 1غهء 11[مزجه -55ع1ع:0172/1811ع. 0151328 115» 5 
(2013 112 27 0أووععع2 

//نمغطر(18)10 جتملصهط8 أنماط ,معطا صذ نهل علط عصغعلهاة' (2013) 1١‏ :85ىمئولاء80 ٠‏ 
.(2014 تإتتقتتطه[ 3 لعووععع2 125]6) /48693750/كع 1 /عكء ناته لحم /صطام رع لصت /روزه/ع0027:01 تاو 

//نصاغط.عاتختاكصآ معمعة عط1' .1204 عذظ 1ه لتمء2 لحته عمتسدمءط عطآ' (2010) .نآ منعنلاه8 ٠‏ 
-220_عقتقططدهط_عط] 'لوطتاح /ىء هل /أحاعغخحامء /وع11/ 1ع ل /وع ]51 /5 11.01 ناس طنطء مرك .117 


.(2012 تاعطمه0 1 4وووععع2 1256) 01م.0262آ_عذظ_كه _لتتءعم 
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3207110313 .[ كلتتطد ,1 رومتللتطط ,.ظ رع الهنء14 ,خآ ه01[ ,.11 ,2211210 ,.خ]آ رع صصمظ 
ته 11610 عط وصتصقءحآ :اءتدعوع18 عمتاسعك5 طذ مغدم ع ناموط عتاطتط (2009) .0.0 


.عع لطع ف 717117.11101:12315/ :خط ده ندع 801 ععمعق5 لممسصتتمكصآ[ 101 لمعه 15 وصتووءوممق 
عن ,201ع1 610112 100101157 1515 شر كل .01م.201:1141 اتاممع" +2251 /واداع متنك 015/00 
+135) 100 ,تامأقستطمه11 .(158لن) امتتدع د80 ععدعك5 [همتامكص]آ 1ه ادع دسععصهعكلى ه10 

.(2014 97إ1قتاطو[ 17 564وعع26 


ذا ,ع108اطتصهن ر,ووءع:2 :2/111 .ععك 21غتع01آ عطا صا مبتطكتته[مطاء5 (2007) ..آ.ن ممفصسئحمظ 


عطا 04 لهصتتناه[ ,04 طاعنتمعوء1 عسمتتقطة 01 تصتتتلصتاصمء غط1"” (2012) .آ.ن ,تفصسعوحمظ 


.1059-8 :(630)6 توع10مططءع1' 20 ععصعك5 جام ته م1مكص][ 1ه تجاع 50 مع تع ملم 


خالا رع1108طتصهن ر,ووع: 1/111 .وععدعك5 عط صا وععتاعة2 إامططعكل38 (2005) .0 زاعع1[ ه80 


5 220 <امتخهءع0125515) :011 5عوصنط]' عصتاره5 (1999) .آ نتهةا5 لصةه .© تعاوروظ 


خالا رء108اطمصهن رووءء2 "1111 .5وععتع نوع قطهمن 


1 /: ,]55181 ,0262 عغ1ط 101 5م ادع 1070م عتذذ' (2011) .>1 ,251010ن لطتة .نآ ملتؤمط 
(2013 تإتتمنتتماء1 22 لمعووععء2 1256) 1926431 حا هنتاوطه /ححامء 


01221013 ,0210 قتط :ه10 قم تأوعتان لدع تدز" (2012) .>1 ,1010كهندت لختة [10.١‏ ملتزمط 


.662-79 :(150)5 رزاع 50 220 جم لامع تطتتصستصده 6 


//تصاغطنتتمتتتاء8 4 ,وعطنة]' عتدملا معآ8 ,لمعه 4ه توطمهدوملتطم عطآ"” (20132) .(آ رعاممظ 


غ125) لصغط.هغ 01-02 -تجطدهده[1تطم-عطخ-يك[ه هط / جه تتتحره //201305/02/<تامء .وع متنا جط كوك 
.(2013 تإتمتتاحاء8 5 4عووععع2 


17117117177 / نتا خط 1 تانتطاءع1 18 روع نذا" عتتملا اع[ نم اثضدء 2غ غهط17]' (2013) .نآ ركاممظ 
.(2013 تتتقتضطءع8 18 لعووعععة 1256[) لمصغط.ه0-غخصدء-1[26-026-يك[ه 10 /حمتستمه//201319/02 لصم 


تلاعت لمكه:5 “022 عتط“ عستلتعصمعع: تخصترم 4ه 4ععم5 عط صمطا معؤده8' (2013) .لل ,مصتاترظ 


/وز0127:01:5/0 0م15 //:ماخط,(18)10 :1/1020 غ115 متطدئمة[مطاءة عتسعلدمع2 امه دزوتولقصة 
.(2014 تإتقتتطه[ 3 لعووععع2 غ125) /7117/48793756/ع اع ناته لم /مبام عع لصا 


85 :111185امتط 00 815-1022 (2008) .8.10 ,هكأة32010:آ حطة .1.11 ,مامكا .لكآ رأمةورظ 


نتءطصدعءءء 10‏ باعك50 له ععمدعك5 ,ععاع مصصدمن طز مطعنام تدا كلدء81 تإتتمدم ست [موع]1 
815 اأتحتذ/وء 00 /عع /197107117.12.01:5// :اط ,تنخ ةه0 2025 177 نامصصطدهت عطتاتامصده 6 


.(2012 تتاعطاماء0 12 40فووعععة 1256) 01م 
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5 11017 :15 1125[ طنز اودع 5 (2011) .21.11 رسكا له .11.آ 11 ,.ظ رددهددكآه زمررظ 


/2تاهع.تتاوة //:صأخط,[5511 (عع 7 هسرمتء2 معط ع4 وص نامحد -دماملنء10 معكلردا -هئج2آ1 


.(2013 تإتتقتاضططع1 22 0وووععء2 ]125) 1819486عاع122)و2 


خا لطعتتوءوع1 01 00طاأعح2 2 25 مناء1اةأقممءء12' (2005) .11 ,عتتتارآع11 لطة .ن ,لم مم8 


5386 .وععطعك5 لمك50 عطا صذ كله0طاء84 طاعنتوعوع8] ,(قلء) صتووعآ .ن لطهة لعاعصده5ك .8 
282-22 .طم ,2ه5200مآ1 


5م15 وععطعكو 06 تاعطمهد1[0تطم 2 نماو ذكتاءعء مولعم عمتكصمعكق5' (2012) 11١‏ أتتدحاء لله 
لدعنع81010 01 تتطامهده1تاط مصه بهذن صا دعنلنن5 ,برع ه1متط 2غ عنتطا 4ه عومدع [لهدك عط 16 
.69-0 :43 روعع مع ك5 لوعتلء مطماظ له 


دعص عستلدع1 كه كء101101 تعكسن1]]' 4ه وزوتولفصة' (2012) .21.0 ,تتدامعلهت 


غ5ة1) 0.001 الاظ- 10711 -0 3/10 لجدمء.21201211ء تدك تمطتدء.,1010117//:صاغط ,عصداز 8 وعتمهةطصطامء 


.(2014 تإتتقتتطة[ 3 564وعع26 
عناطنا2 عغط]' .عوصقطن لهك50 لعصصداط 01 أعومحصطآ عغطا وصذووعءودة (1976) 10.1١‏ ,ااءطمصةت 


.ع نطوم مسوآط بوعآ8 رععع0011) اناه حساهمدحجآ متعغتمعءن تنكم 


.1-5 :47 ,رعطتمهع112 ووع صذقناظ + تإعع512 ,101705 01 ععطهة1مصع1 عط1" (2007) .11.6 متهن 


0 قتأمم5010ع3كء :101 عمطوط اتتعوعل كنخذآ! عط رطهاتا ما عستامعاء؟11' (2013) .1 ,لامضتهت 


/14/ناز/70110/2013/كلنا.مء.2ة71707.512101//نصاغط .عصداز 14 ,سمنلهمن0 عغطص' تمعتتعسم 
.(2013 تإلدز 8 4فعووععع2 1256) واتلاعه0262-1-طماه سوقط 


ه015 لاع 1ةء5ع11 01 51111767 لل :1521017221013 :101 35ك[00.آ (2002) .10.0 عقون 


ملم رؤوع21 عتططعلوعخ نتم تتقطاءظ لصنه ,قلعع81 روسكاءء5 


عتمتمدامء8 روع10مصططعع]' مخ حط1مكم] :تن لمدمتأمستمكمآ عطة' (1988) .21 ,كلاعاقهت 


.1 ,لاع7ك1لء812 .ووعءء210 لا2تملعء-صددحاءرنا عط 220 مداع ضاوع] 


,مااع 812 «اعك50 علامماع]8 عط أه عدت (1996) .11 ,ولاعاقه0 


/لهء .تلع ذ5ع 770 طتوعة تكنتام.710707؟/ /:اخاتعستصط لح نمئزوء12] نإ بإعوحترط (2009) .لى مسممتكلنام كه 
.(2013 تاعطمغاء0 15 0وووععع2 ]125) لجاع حصتنام-لطام//10205/201310جتا /غسمعغخصمء 


.(0415) تناع 575 210112101] لدكتطءى جاعم 0 حتهة 101 [ع1100 ععمعنرعقع8 (2012) 5105د0 0 
.عتاطنام//:صاخط.ن)0آ1 ,دمأوصتطفهة؟] ,قطتعأور5 1022 ععدم5 101 عع تستصدمن عكتلد كمه 
.(2013 تاعطامء0 21 0وووععء2 6غ125) 01م.650:20122 /عكتطءعته /مطمتغهء 1[طانام /ع 66305.01 
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//:ماخطرطء 1/2 29 لاعلجع1] طاعع]' متتته2 ,022 حاعدزه 1ه تإتامأقتط لعتوط ل ' (2013) .5 ملتمسعتطات 
8 لوووعععة  )1256‏ لهل دع حه-ةمأمتططناع ةدا //201329/03 نامع ,تلع تع تاعع اك هص اك 

(2013 تاء اماعامء5 
و(ع5]126 تأتاعتاعع22ة]8 سصتمطان #راممنتد (2012) 2 ,للصتعل8 سه .5 ,ومممطن ٠‏ 


117] ,اموتدء2 .امتاتلء طأد5 ,م هضرعم 0 له 


617 1512©55ا8 21215210 .2 تتقططع011آ[ 72015مصصآ عطآ' (1997) .0.11 ,معقطع ]سوقط 


.]ا ,عع108اطاصصةن رووءعط 


غ10 ذأع© ناملا غنا20 حنه نه مط 1مكم1 0ع1نهغء12 1101 نلته1' غ102 عط م0 (2006) 012210 


دده 6زممع1 ىم .متطمقطه126ع1 70 عتحدآط ناملا ممسمطمد طختم1 مدم لخن هجختصدع01 04 ملصدآط عط 
/-10205/1/1337106نا/وء.ع تدصك.1707907/ /نصاخط ‏ “إتأكدكسآ ععدنععاه:8 غ102 سمتلهصهةت عط 
عتصتانت أوعنتعاصآ عتاطناط لصه بإعتاه2 أعمععام]1 صسمنلمصدن عغطص' ,كلم. ممع خآ مععاه1 1022 
.(2014 2177تتطه[ 17 4عو5وععع32 ]125) 0125072 

111011 50111025 وقطط تحط وغهك علط :4عئ51كة عدمتادعنقو هآ8' (2013) ..آ كلتهانت ٠‏ 
-نل27725/-201316/01 /عتحكتطاء 1ه /و7الكع<ا /كلنا.0ء.0ع179797.18711//نصاغط لإتمتصه[ 16 ,لع811] , اتاصصط 
(2013 ةناد[ 28 0وو5وععع2 ]125) أعصنه1 مهل -عتط 

01 121621015 اتطحطون ,عع طةاللئء022 لمعنه أرع0[مصطعع] دمت همصمكمة' (1988) .1 رعكلتهانت ٠‏ 
.498-12 :(31)5 ,46011 عط 

عط]' عع طذطللئع11اد 0262 مغ طاملعهء 1امزجة 15 له محهذتتعم لمعتل عط1" (ه1994) .1 ,تهات ٠‏ 
77-2 :(100)2 راع 50 مناه مم1 

1211281212 :قتاع ]5775 011221101كط1 نز مكدع طظتامعء10 سمقسصسيط'  )19940(‏ .1 ,عكلتهان ٠‏ 
.6-7 :(7)4 رعامزمء2 لخته تإع10مصاعءع1' هنأ ستتمكه] ,وعنادذاز تإعتامم عنتاطنام لصه دعومع ]| جلمد 

-7071977//نصاغط .تممخه1وم2مء 181/1 ,1811 هنم علط كدمتات[ه5' (2012) .1 عونء8-عتن كدان ٠‏ 
.(2013 تإلنا[ 9 4أءووععءة غ125) 0262.501آ_5_815ط222[01/1_2012/5011310عاع2 /مخجاعر :ا /ححامء. مز 

أناة1' 220 تإعصعتومعطهع]' ععصطة[لئء5111 عنلهةا5 عنأهكمممطءآ1 (2013) هلل ,وامعصع[ان ٠‏ 
77 إنصقط ‏ .طاعتدلا 17-18 ,مغدهه1' 01 أأوء تلصتا ,ععمع مغدم عدوهل1دتلى حاون 
-]115ةا -0 2ه -توع عه مقطة1)- عع طه 1 لاع10157و-ع5]26-ع نخدت ه مدعل //201303/هء.عتاع ه1 هتلع ماق 


.(2013 تإلتاز 8 4عووعععة 6غ5دط) تدع صسعك- عله سوط 


علتملا 7ع8 رعده1ة امو 1012 مم20ل تإقحط عع1ام عله “تعمممطة' (2012) .5 ,10مكتان ٠‏ 
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- 7[ -5اع1122211ء 5110 /55ع115112 //72/2012.10/08امء.5ع .170707 //:صااخط ,أدتاوتث 9 ,وعمطأ]' 
.(2013 أكتاوتتث 8 0هو5وععع32 1256) [لتاطا.ذتاء مم طاة-101-وع6ع11م دم اج تمامأكتهء 

تكلصةط هغهك لعتقطاة ع122:5 101 نمك 04 لإعل7200 لمممتكهاء ث' (1970) 8.8 ,6000© 
3777-7 :(13)6 ,الى عط 1ه قطمتاهوء اطتتمستمطه 2 


عاطهةغ لطنام2) #إتتماوااط 21غ1ئع01آ 2ه عمتصدمعط عطط' :مغ م ماطاتغصمن"' (2008) .(آ يمعططامت 


452-17 :(95)2 ,1115601 دع تع طخ 01 0111221[ ,لاه تمدمتكء كلل 


النتصاخط كانامساع]8! حامنتوعوع8] وععمعك5 1م50 1017 تإعه كلام 15 غهط17]' (2012) .[ يسعططامت 
(2013 تإلناز[ 16 4وووعءع2 1256) 10-2175406_أعهنتاوطة؟ حمتء.ذتاء مردم/012/5013ع.11دة. اع صرةم 


4 غتعادم 06 وعععام دامتللتط 2.5 0287 5كاهوطاععج8 15 علط 2087" (2012) .[ ,عصتاقصه©6 
حل تتتاتاعطاعع]//:نصاغخط ,أكتاوتتكثظ 22 ,تاعصتتكطعع1' ,بهل تجرعتكه لع أدععصذ دع رطومء) +500 
-2120-500-خداعاحامء -01-وععع ذم حطه1[[أطا--014-0262-25 و داععه15-1-ع 1017-1 //201222/08 لام 

.(2013 ناته[ 28 4وو5وععع2 12516) /تجهل- عع -لع دعق صت-وع(ط هع 


.49-59 :(23)2 ,111154 ,؟قاءء]10م 80 :تإعوكتام امكوءمآ' (2011) .ن ,للقعغم6ن 


نا مططهن) عغطآ' رقصتعأو[5 منغ ممتتتمكص] صذ وعودع [لهطات طعموعوع8 لصدع© (2003) خكانت 


لءو5ععع2 1256) 001.قتدعاةرد.عع /5ا1ه0جع1/ع:01.هتك.ء كتطاءتة//نصاغط .تمغهكهوقة طاءنتهعوعسر 

.2014 7إ1قتتضة[ 16 
1711502 ,.11 ,ىق 2عطمعغ5 ,غ1 ,دمغ [عطد .لل ,كتتتطاتةه200 ,.11 ,تضقطة0 ..[ ,مام صصهءن 
4 1022 عنظ' عضناع1تأقدمءء0آ1 6127© عط لسصمرءظ8 (2012) .21 كأههت لصة .1/1.17 


7(تأطهتاع معع / 2ع اتنا اجالع تكلن.7077/ / :خط ,جاع ورمع عطلا كه لمتخمعغه2 عطا مصاع ه:ع1.6 
1 0ه556ععع2 1325]6) 0114م.0628-2012.10.01ع6-عط-لدمرء 15/2012-8 0[ طعصنل دع /ول مطاأعحط 
.(2013 تتم تتاحاء 1 


.3 ,ع538 .وعلطمة1عمططاظ عصذه2آ (2007) .1 كأهه00 ممه .81 رقصهةءن 


,5105 191617 ووع طاقناظ 1215210 ,8غ علطا آه وعمقلط معللخط غط1آ"” (2013) .>1 ,10م جهن 
للء5قععع2 1256) /2غهل دعت -ستدوع 25 ]0ط -صع 00 تطآ-عحل) //201304/ع:1ه.تطط.وع 10ط//:صغط ملتصثى 1 
.(2013 تتأ طاتصعامء5 18 


777 :اط رناعل8 عطا جده حسمتمممعا 1ه تع 10هطاتجمم عط1" (1995) عاطاسعمصظ مرخ لمعتاتين 
.(2013 13/127 31 لوووععءة 1256) 01م 2اع 2 /لهاتع تل /كآههط/أعط عه -لمعتامن 


1207 الصمك ع1 ته ,عناددا مخطعت 1لتكك 5م20 تعمعع تتتاه 15 0212 815" (2012) .لح ,لامدت 
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امراجع 


لل 7الئع0*8 .دنلع]2 بوللئع] 0 حدمم دع كتاعءمومء2 اأمعتبان :21037 10214 عنظصا 1 
.55-9 .مم رشن ,01م5)0هداء5 

//: خط طاطاع: 810 18 لمعنه[ اأعع51 117211 ,171017 8151022" و2 متدط 0" (2012) .شآ رتاخ مين 
+01)135غط.53204578126671124151266 3 55 /ع1ع11ة لدم . (135.عصتلمه 
.(2012 تاعطماعىوآ8 19 0فووععءع0 


12401231ع م1 ,(ملم) القتط1' ١].‏ لصنة صستطع ك1 .1 ص ,نل م طاعصط برع 0ه[ هعصعءى" (2009) .10 ,توع010171 
.341-4 .م« ,02010 رتع1وع815 .4 .701 تتامهتع0»© تتقصطط زه منتلعمماءتروعصظ 


لم22 :وعسصتاءمء ج17 امه كاتتهمطععج[2' (2009) .11 كامه2 لطة ‏ .11 نتعطء تمن 


.5223-4 :(400)4 ,1تا0101»© ,لطتو عاع00© سايكا -1وه0م صا وعجزهء وت انق 


:اح رلته ناماع 25 ,اك تحدم ممء8 عط1' رع عط رمعت هغل ,ه10 (2010) .1 علد 
.(2012 تناع طصعءه[8! 12 40وووععع2 5)6د1) 15557443/ع200/حتامء. 5 تمامجامءهء 


.20-5 :149 ,قتاء11نا8 5آللة ,عصتلدء: عومك 1ه ووعصءومك عط1” (2010) .[ نتعللندت6 


عط 4ه ملفصسة تسلدءع عتدكلم عط لصنه لمدك تحتلصة لمغتوتل عطآ"” (1997) .81.1 تمك 

.681-99 :87 ,تع طصة1ع 60 تدعت اعمط 1ه امتأمموممق 

4 5775]6125 1570135 تإعتطاعع اع صا ' (2004) .211 ,ندوع1 له .[.0آ رومتلتئطط2 .1/1.15 لقتنت ٠‏ 
.357-69 :20 راع 50 مهدح 1مكصآ عط]ط' ,وععهام لصه عاممعم 2ه 'عتلتطنوع1 عستمععءى عط 

لاع 2156 101 هذم؟ عتنااع امه تكستعطاتر' (2007) اأعصنامن عتتتاعدضاقه كستع انون ٠‏ 
لهطه6 1 ,ندع 1ه ؟جدزئتء 0ط /2007/510728 /وططاتام /17077.51.507/ /نصاخط ,تع -همعءوتل 
.(2014 تإتتقتتطه[ 17 0وووععع2 1356) 00آ ,اماع صتطافه11 ,ه00 تاه ععمعكن5 

عطلا لأتدعمعءا عصتععنل :10مع غ20 ذا ذتتع ]تناع غهطأ 1لش' (2002) .0.11 رتلصد© ته لل بقصصهج] ٠‏ 
.373-56 :40 ,وعنطاظ ووعصتكناظ 01 0101021[ ,أعصتصتطط مغ 01 ععه1د ناد 

ماصع عغطوء صا هج نلعحط عط ممه وتكعط :عق 50 هتاه متتمكصا تواتدء صخ ' (2000) .لآ مصمغصة0] ٠‏ 
.1-0 :105 1691658 1115011221 لتدعتاع متخ ,ناعتوط 17 لمعه 

له د5ععصعك5 5021 عط صذ حم مناه الله حامتكهتتعوع:2 1012 جبقحطل805 (2012) طادزقهةآ] ٠‏ 
-020232-101خآ_-_5/104.1ا:1ه تزعتاءء زهنام /مدم هع ناطنام/ناء.طمتمه0//:صاغط 2 ,زعا لممسن1آ1 
.(2013 تاعطماء0 15 0وووععء2 1256) 5511.501 _عط مه 12نانه_لطة _حام ته لاعوعرط 

//:ماغطرهغة2آ جاعنتهعوع1 لمع ذدآ :ه10 وعصناءع 010 طتلهن0 (2010) 121معنمجة 1ه 521 10260 ٠‏ 
-1_غع201327/09//053-500116/ءناطنام_ننع51/دخلء صطد/ع101721.01مصه2101ء 0225 .تكو 
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امراجع 


.(2013 نتتعطاماء0 8 4نوووععع2 1256) 01م.2010ع تناز 


.ع تتنططاء 02603 //:نصاغخط ,أدتاوتتكث 8 ,وعغ51 10262 دطعم©0 ع 11011100 (2013) لععخنصسع 1221 ٠‏ 
(2013 تناع طصطاع ه81 4 لعووععع2 2516[) 5ع ]زه 2 هل -طاع دره-ع201308//70110510 /لحامء 


1/111 طعت 111ل[ 15 228[ عذظ “ 2107" (2012) .1 يمسوعظ لصه © رطاحةدظ8 .1.11 ,ام ممع كه 2[ ٠‏ 
-2012 /ع2 معش مط -عط)/ تتلع. تحط رع نوع تطهه51//:صاغط وجلدا[ 30 كعتوع]1 لمعمرعع 8/1222 صسدماد 


2013 تإتقتتطه[ 28 4عووععع2 غ125[) اخدع دع 1ل -15-هغخهل-عنتطا-1مط/1211/54104 


ولإكققاناطع1 23 ,10248 عذظ/ 178 ,#أمدعط 5تهط117 .0دعل 15 "مغمل عذظ“ (2013) .[ روءعه© عل ٠‏ 
6 #موووععع2 1956) /اعتعط- مه ط-20ع15-0-ه201322/02//615-026/حتدمء .هع ماع تتططع؟؟/ /:صاخط 
.(2013 تتم تتماء18 


رأأع22211 4نامع 2ع0تنا عط لصته ناع 116" (2013) على ,ومم5660 لصة .0 ,تاعطء381 126 ٠‏ 
-11 اع تاروع لاع أ تاععوعتعط /أ1. مغ ت[0«. معط //:صاغخط 18/136 22 نتمستدءد5 طاعصسسدآ مععاط غ11 
.(2013 تإتتقنتطة[ 3 560وععع2 غ125) 2.501 مم50 - تاعطاع تصطر_عل 


5218 ,2 1013 ,.0آ ,0و0 ,2 ,قمع117913 ,.]/! ب289تطاءعى متتاء تو[ ,سآ صما ,.1/1 روعنت1؟ عل ٠‏ 
:ماع56 عناطناط 1ه عصاعةءط (2011) .(آ ,عنتامطعغتط117 ته .[ نتمصصهن 0 ...1 
ء55ععع2 1256) 01ص5.7[ع00تتط/وع51 / لداعل /ردع اذه /ناع. تله 2[ مومع //:صاغط ,(50515) تولنناد 
(2013 أقتاوتتث 11 

رع 1أه1ء10 .ه61 220 1212017202 وواتتتصعوص] عصتك0آ1 :1022 معم0 (2012) علزماء2] ٠‏ 
/5أء219020.455ع12/10 1412800 لع ]دنآ حدم دآ /كاء255 /حتامء.عغ]]101ع17717.0//:صاغخط .2ه06جم.آ1 
-ع]]101ع0-د5خطم 1ض ص1 -علن /5وء771[ 2 حك 20 90ع]1011ء (آ /وخطع 201251 90غعع1/1211 /5 1ع مدناء 0 0آ 
.(2013 أكتاعنتتث 14 5560ععء2 125]6) 01م126-2012.5ز-0262-تاعمره- دع نات [مه 

05 0171م 0371 121560 قدمتاوع 010 (2012) .8 راععا5 له .1 ,و1عغه11 ,.ى ركجاوهمطصءج[ ٠‏ 
أكقتك كحت لصتم .7907197.1؟/ /:طاغط نتعطصيعءءء10 11 ,طتطط طاعع]' ,وعسةط' لم ءسصفمصاظ ننه عنط 
.(2012 نأ طمرءءء(آ1 11 أوووععء2 1256) لمصغط. 0علطوء772-4000-112-2212-0014414 5/092/1576 

كد50 نععناع 2م حصت -وعزع010صطاءع) هد 81325" (2006) .2 روعلنه11 لصة .1 ,الهآ] ,>1 2[ ٠‏ 
8 10مصطعع]' ووع81 ,ماع12 لهدمنغغدمتصدععه 04 غ01 عطا لصه طتلمتتع 722 ,ممتاع نم أوحممء 
-229 :(21)3 ,تداع مزه محص لصة عاتده7ل1 

لهع 5625 01 7تتماولط لك :وا اأصبلط عوتتهآ 1ه وعتكتاهط عط]' (1998) الى روع 612 زوم2وء12 ٠‏ 
.خا ,ع108اطتصهب ,ؤوع 2 وأذواء كنصتا تتم .طامتداط .ن بإ ع05-126ة1 روستدمموع]1 
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امراجع 


م5386 اكتطذد 1021© عط]' (2003) 8 ,مععل 1د[ ٠‏ 

أعحطدزهاعع0 لحته (5)صتوتده عطا جده عكتاععءمومعم ل[هدهونعم كش (2012) .1 ,10[وطعز1جآ ٠‏ 
.17177.55 / :تغط عصتاميك 015 عط لتحتهة ,رصع عط ,دممعحصمصعغطم عط :منه علط“ 1ه 
5 4هو5وععع2 1256) 2.5014غ02آ_عذظ_10هطء112/101ء ردم /ؤتاء صدم/010طع1ل1- /نال»ء. تدع مزتا 
1٠‏ بإتهتختحاء ]1 

//:صاغط ,11 2012 :70 مأاممع] عذزه1' مده 1م251 ,نهغهك لعكلصنط' (2012) .(آ رطاعتئعتد ٠‏ 
2013 أكتاعوتتث 14 5560ععء2 135]6) 0212 -لعكلطخ[-]1مجع1-ء أده /أداعغحام /ناء. ماده 2[ مرتومء 

]0 واتله نعمت لدع عط :ععدمد/ع00ء اعتامغطا عصتجا' (2004) .1 رصنع ك1 لصه .21 ,عع1200 ٠‏ 
195-77 :36 ذل قصطتصصةا2 نه غخدع معدم حكصظ لاع كوم عله 

-ع نع قحط عط لصت دعله0ء تمدع 5 تمصع ل1 :عكنا زه وعله00' (2005) .11 مستطء ك1 لصه .81 عع1000 ٠‏ 
851-11 :(23)6 ,عع0م5 220 تاعن50 :0آ قصتصصحا2 مه امعصصصمعتحمط 1ه عاطهلمء 

هه 5ل1ع1157ل ]0 الاعتاعع 12323 عه ماماتج عط1"” (20075) .1 رصتطءغق]آ[ له .21 ,عع1200 ٠‏ 
.264-75 :(133,38)02ت1 6010 ,أوعع2م5 عستحتيل 

كلوه كاعم :”عع 2ع ]قلت 11 عصتحامء 01210110 دعص ناه 0" (2007) .خآ يستطء ك1 له .21 ,عو1200 ٠‏ 
.431-45 :(34)3 ,8 قصتصصهاط لحته العصصمختحتمظ تعستااعع 10 4ه دعنطاء عط ممه عسنأنا مسرم 

:1201716085 220 ععمعقعمت ومطامصة31ة  )2013(‏ .1 برصتطءق1 مضه .21 ,عع1200 ٠‏ 
.19-6 :(45)1 رذث قصتصصة 21 250 أماعحصصم 11 تكصظ ,”وطصةءع مامهء 4عء1تاه 01705 

4 5005]عج<ة روع1200 عصاممة]82' (2009) .1 برصتطءغن]1 مه .0 ,كصكلت2 ,..81 ,عع1200 ٠‏ 
قصكاتء .ن) لصهة صتطءععك1 .1 رعع1000 .11 صذ ,560015 حجتهحط 101 ماوع تسممط 2 :ممع ممم 
.220-43 .زم بطه0<ده] رعع1]011160 .وصد/ة عستكلصتطاع8] ,زقلعء) 

اداع حدم ماع07 عكلغهنءطناعل ,صعجزه 012105 :تصتاو 2 عكلتا عصلءء5' (2012) .1 ,صهامده12 ٠‏ 
97-4 :(13)1 ,روتتتهكف لهحاه ته عاص[ 01 1221ناه0[ تتوماعع 1مء 0 

خالا ,ع1108طتصهن رووع:2 :2111 .15 دمتاعة عط عنتغطنةا (2001) © ,طامتننه12 ٠‏ 

عع طعا معت عطا لحه ععطعلاء جوت 01 ع اناعد تامه تكطا عط1" (2007) .© ملاعظ لصه © بط35ناه2آ1 ٠‏ 
رعع0م5 طتتم1 وتاعأمدامعم "جلاع مل عتتاعنطاد له عستسصدعمط ع1 اكه كط 01 
.414-00 :34 رآ قصتصسواط 124 داع ص10 تمك 

22525 05 تإامأقتط لهاعه5 2 :0204 عتط“ مغ 2105 لعأعطتام ددسم" (2012) .>1 ,لأمء0115آ] ٠‏ 


/0/1011مء/1صا0ع.5.152255ك[:133701مطء5//:صاغط ,(1)4 ,1+ طملغهء1ستتتصصدمء تصنت[ تدممم 
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امراجع 


.(2013 7إ1هتاااءع18 22 40عووععع32 125]6) /15514 


اه دع كتاعء مزواء2 ألاع نان :11017 10212 عا8 صذ ”0287 علط كذ غهط187' (2012) .8 ,التطصناد1 ٠‏ 
.3-0 .مم .لخن ,آه0م0)كدطء5 ,هخلع21 اوللزعك ”0 .2نلع281 اوللئع5 0 


4 تاه[ أعع 5 1له187 ,*175مطعا غ1 خقط؟ وعوم1كء15 تتععام2ةط 1024 (2013) .]1 ,رصك[رم:101 ٠‏ 
1 هط ك-وع 5ه 1ء 15ل -1عع1[ه :1ط ه026 //5/201304/09أأع نل /حتتمء. ز510835.175//:صاغخط 2 ناء طاتصعامعه 
.(2013 ءعطمغء0 11 0وووععء2 125]6) /115م0 ع1[ 


97177 ووع مامناظ 21215210 ,لطعم صقط أكناز صمل “إممكاعتبء" غ02 عذظ' (2012) .[ رعطءرج[ ٠‏ 
لء مطقط_غكناز_غخطوء00_معاآع نا //201211اى /ع1ه:اطط.وع10//:صغط ناءطصصعهل5 20 ,وماظ 
.(2012 تنء طماعمده!8 23 لعووععع2 1256) لمطغط 


:1225101 ,8120117 52635101 علطم - 0368 تعره 01 عتله؟ عطك1" (2013) .([ روعكو8 ٠‏ 
-21ه028-00-تاء م01-0-ع17213-عط//201325/04لهء.وعككةء //:نصاخط ,لتدموثم 25 ,طم عتمنوعل 


.(2013 تتأ طمطعامء5 18 4فووععع2 25]6[) /متاع ل نتاوع0-ع1 قوع مطح ط101ع -ع:25111 11 


و1[7هقاناطء1 25 ,0364 01 212011125 7/105]10115 :طعتتحط 0مغ للف (2010) عغط]' ,أمتستمدمعظ ٠‏ 


.(2012 تاعطصطع: 810 12 4وو5وععع2 1256) 15557421 /ع200/حتامء. أ كتحتامجامعء.7تكو؟/ /نصاغخط 


77.615 :اط 1/133 18 ,ع صتصل1مع عط 2 نهغه صعم 0" (2013) غط1' ,أمتستمدمء8 ٠‏ 
-01110-52111-1045ع-ع11111م -262 -121 023 -ى تكله مط - 4 2157808 ودع 515 نا حا / 5 ل1ع 2 /ححامء 


.(2013 تع طتمعامء5 16 4وو5وععء2 125]6) عسنحصل1مع -تاكعط ده تاحه1م صا 
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.338-46 :0112[1,42[ ققطع 575 181/1 قططع كرو ع128ماد دده وعكتعل عامتل 


ع5 0262 عكتاععقء نه 222017160 عطا عطتاء7701تتء :0264 دعم" (2011) .81 رصاع دميو 
.05/112022 / نحا / جره اكلعء / تحاط / تتلع.عننا .كوا / /نصاخط ,(16)2 :1/0203 أوتذظ ,عمام جرعي 101 
.(2013 تإتهنتتماء1 6 4وو5وععع2 125]6) /117/33162764ع 71 /ع اع تاه حم /صصطم 
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-01-2 -0111 210 -0262-2-]11211212ء077ع - 2ع مه -201303/02//15 /تتامء.ووع 1م 11701:0. اع 5 1ناع 


.(2013 تلإتتمتضطاءع8 6 لعووععع2 1256) اتعاهمط - دوع هل -تجطا و لصه-عع امعو 


27م0غةمتمكصة لمعتطمممومعع 760ععغصن[ه؟ 15 00مع 517" (2010) .21 ورتملكله11 


81101121 ,أمأء02625 5111577 عع طنط 01 ته جبدطااعع 2 دع م0 1ه 51077 21225 مصطامء 


-682 :8,37 وصتصصج[ط له 


[ ,5مقطن 04 ع808 عط دنه لتك ,0265 عنط لحته دعنا 4عصصصمل روعنطآ' (2013) .(آ ,وعله11 
/028-م 1ط - تنه -دع 1[ - لع صتحصه ل -5ع201301/02//11/مكستععولعع تخد ه10 //:صاغط ,2013 تنه تتتحاء 1 
.(2013 تإتتمتتتاء8 5 لعووععء2 1256) 
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.666-59 :16 وإعنآ20 كام لامع تصتتستصدمععاء1' ,اناه اعد لوط ل2هط كه عنتتطدظ عط عده1 

1 ,ااعكء812 جاتن عط لصنه ععناكن] مك50 (1972) [0١‏ روإعكتوآط ٠‏ 
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غ125) 710-1988603تمك.1نهاع0 /12.015ع2.عناع نان //نوصاقخط ,عتاعن0 411 ,لأعتامص 
.(2013 #إلتا[ 4 4عووعععة 
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:5111567 ع0102326 عط 1ه توطمرمتعه81 لل :صم د81 2 1ه جبد81 (2010) .1 ,تع ٠‏ 
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.703-05 :(10)331 ععطعك5 ,له هم مقطا عاأامحامء لله ,علوء- تمتاستصامء 
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.1-5107 عداع ا -أومء -تامطاع تامط/عء11ا50ع/تله.ع01.كلطته / /نتصاخط ‏ «جاذوءعحتصمنا 12«ماعلما 
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ملآ العلا ,رع 1015 دنملطتة]1 .قطك131ه01017050 (2008) .[ رع8017 ٠‏ 
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.(2012 تناع اصع ه81 12 0عووعءع2 
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01 بكأناملا تع ل[ 
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.(2013 تتعطماء0 21 0عووعععة 1256) حتتاء.طل_ترع 10م صتصطططعغ_2ج17/ 5/152 5.01ع21 0 ا عاطط .كو / /نصراغط 
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.5ت 232 /15.55112.60172/5013» 222 //:طاغط ,/82012 نتعمة2 عصكالده1111ن1 , 7صماومة؟ عاءع 1011562 
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6 ,ع0485ش .00 1 25 غ20 ره52 1 25 00 :0264 عأ م جاعة10ممة 25تصوط0' (2012) .1 ,عترووكا1 
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ركط50 لتتهة 7إع11711 صنطمر .وعئن1؟ عط صذ 180114 عط]ا' تععومومءطنون (1998) .1 رصتطء6ة]1 ٠‏ 
تتعاوع اع تطات 

.© له معكلانة .5 صا رععمعكة لمتغهمة لصه توطجيةيعمعع عناوأكتازوه2' (2006) .1 رصتطء )ك1 ٠‏ 
.20-9 .مم .2002ه] رع528 «تطأمرهتتع 060 اطنط صا وعطعدمءمحرخ ,زقلء) عستغتمعله17 

هه 5عع 2ع لهك ,نع تأتصن1همم0 :7تطأصدئعمع5 صمتصتط لصهة منهك عذظ' (2013) .]1 رصتطء )ك1 ٠‏ 
.262-7 :(3)3 ووأصهع 060 متبط صذ وعنع01210آ,: ]1151 

بل60[01111 ,تلطه طئ1نا اتتقحطد لحته منهل عتظ #ترإأك عمطننا لدع عط1"” (2014) .خآ رصتطء6ة]1 ٠‏ 
1-14 :(1) 79 
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.22-3 :2 ,و5101 مع8010 5وه0ن 01 221خناه[ر1ط نه مصامء 


:21211665 125أم م23 155ل10مكصتا' (20122) .21 ,عو1200 له .[ بطموعء1© ,1 يصتطءعق] 


امتاتدظ 01 عنتتطتامصآ1 عغطا 01 كدمأعدعصهئع]' ,وطمةئيومامتهىء 101 (رع10متسطعافاص اعمط 02 


.480-66 :(38)3,وتاع اهزع مع 0 


(2012) .كا لإعصعموع]آ مضه .[ طموعع01 ,.80 ,ع8091 ,.ن ,صقطعة1له00 ,]1 يصتطءعغق] 


220 اع سمتصطهتتكصظ ,تتعع 11" عتتاءعن 5لصماءءآ 6ه 1211 سه عن عط :دمكتلهة طتامعم عمن هام ' 
.1302-6 :4,44 قصتصصواط 

01 5ذأوتولقصة لمعتاتك 2 :5120015 عصتصصتاطاد ,مخصتاص)100 عصتااعع201' (2011) .[.8 ,رومهمك]1 
.229-66 :(8)3 ,50161210 ,ععناءة1م 0264 علط صذ "معنامع :101 ع6 م غخطوء" عط 


012-1217 2 - عكتاءء قاعم وعتاك اتهحطة' (2012) .0آ رآع125-8ى جه ,2 ,مبحصم] نض ,.كآ 11 تامك1 

.229-46 :(25)2 ,12120121013 ,:120235 متختصدع11-01ء5 01 متتدعحط نزحا تج0نة نوع مر متنا 

مكتعتطن 01 #واأأواء حتصطنآ .كطه0ن[ه90ع1 عطلتامعك5 01 عتتأع تماد عط1' (1962) 1١‏ رصطتك]1 ٠‏ 
2 رؤوع 21 


3 10111107 وكاععع 022 غقطا 2105هطاطممل داع لع مئزوعل0-و[لنكت سوعط 24' (2013) .ن ,عكلة.آ 
لع تع نوع 0-:117ن تأ تتدع ا - -6284424/ع10/ع1/ تامع ,نوع طة ]1ن قدامعع //:صاغط تإعصهغ ]1 1امدمءظ ,عصيار 
.(2013 تتعطصطع ه51 12 لعووعععة أقد1) ع1111-1017-وكاععع-26-0262طغ-21205هططامهل - داعب 


ع جاع نه له تاك هأء7 رعحطن 701 0262 عط ذ[0 جم :ا اعطاعع 12312 1262 310 (2001) .نآ تإعصةآ 


-1ع12ع5/201201//209493-10-10262-1/12238ع1/تإعصه ع نهل /حامء تع صا مدع.دع 10 //:صغطا ,تاه 
.(2013 تإتمتتصدر[ 16 لعووععع2 6مه1) كلم اع تعه؟ -لصة-تجاكماء؟17-عسساه؟؟ -022آ-عوستلام ممت 


,؟ع11085طتتدن ر,ووء21 واأوتاء حتمنا 812157210 .ماعط صذ ععمعكق5 (1989) .8 :210111.آ 


:11228112210115 لدع تطاصةتتع 60 220 5ع:11اأء1 111251 ,10262 (2012) ,1.2 1210113101111 


1 وإ لقاع كنطتآ طاماع1تدن ,كأوعط]' .([بطط .202 دن خط وعء115امء18015 ووعععظ 10268 
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عله 0362 1003775" (2007) ...2 عونا له .10.1.1 :ته123710' ,.آ.8 رعنهة1ن ,1.2 ,1نم تنمآ ٠‏ 


.123-79 :64 فته كتطعتة ,وععطعكة عطا صا وعنادكا1 لوكقطءتتة نحاء توعوع1 01101175جده] 1ه توم 


11 10221 20021م6605© (2013) .8 تلع صصعكا مه الآ أأعكاءع112 ,1.2 ,1نم نهآ ٠‏ 
17 220 ستتتتطامة ,روصناكك 111 ,ه017 «تعصسصمم 


ر5كلة115طن) ,.0آ جمءع1ع21 ,..آ-.لىث ,2310851 ,.5 م[وكة .سآ ,عتمطه كح ,.خ ,0 طماغطء< ,.دآ متعجة] ٠‏ 
0[ (0ظ1 .1 ((ع113 ,.0 يفتكا ,1 165310[ ,.1 تلطه اتات ,.[ زتع201071 .لظا اماع ة صمت .لل 
.323:721-3 رععطع ك5 ,ععطعك5 5021 210221 مده 0" (2009) .11 رعصواو[ة مها مه 


(2009) .1 .مقط لطة .5 بطتواظ ,.84 ,ععوصفاعة .281 و8352 ,.لظ روع59ة10 ,.8/1 روصتصطعآ ٠‏ 

لمخدع ططممتتكصء عه مكاعد كمعد متك عمعع- معد بلتتدط عط عصنتامع امم" 

-02]8آ تمع نهد ننه عطآ' رزقلع) عللهط' .>1 لصه بإعاقصةط' .5 جوع 1١‏ صا ,عم معحهقو 
45-7 .مم .ااا ,20مطتلع] نحاءتهعوعظ1 غ1/1160501 ,تإتاء01ء015آ عطتاسعن5 عتتممعام1 


77 :ا راء طتاعءع10 17 ,روعدطةا' علتملا بوعلة بك عط وعكاهة املع سوام ل ' (2010) .[ نتعنتطاءآ ٠‏ 
.(2013 نا طتعءء(آ 23 لع5وععع2 1356) لصسغط.-أوء11_صدط:]19 /عص تدع 2حم//201019/12/تامء.وع ستاتوم 


عطا طذ لاءتتوعوع1 طع 026-0135 01 عقدعة عسصتعلمحط نطمناعن0مغصة' (2012) .5 بملتلاعصمع.آ ٠‏ 
لدعاأع 81010 02 تإطارهده[1نط2 لحنه إتتمأقتآط صذ و5101 ,أوععمعك: لدعتلع تصمتط لحه لمعتعه1متط 
.1-3 :43 روععدعك5 لمعنلع سدماظ ممه 

120117165 01 قتتع 5775 عنتدمنتاءعاء نعكتلة عصدم 5أون1رآ' (1999) .81 راكتتط]' 0ه .ىل ,مطووع.] ٠‏ 
.434-66 :28 تراعن50 220 وتامضمعظ روستلصدط لتماعز صا عستهمء5-اتلعتك 01 ع5 عط لصهة 

0111131[ ,12511565ع» 111361012م70 امآ 1ه غخداعصطمزماعع0 لحته 19امأوتآط (1991) ,1:2 مممطعسصت] ٠‏ 
-1(:91آ20171)1 ,ملصماء:] 01 تجاعك50 تإتننتوص1آ 1اده5 لصه لدع 565 عط 1ه 


9 رقعطنة]' عتدملا ع81 ,ممأتتطصا 15 50 غناظ أدعمع 15 212 علط رعنتتاد' (2012) .5 نتطم[] ٠‏ 
- تاها - انوع تلع -5-0262-15 01 /تإع 010تتطاءعع] //201230/12 /حتامء.5ع متنا تتط.17077/ /نصغط تع طصعءءد[1 


(2013 تإتقتتطه[ 3 لعووععء2 125]6) لسغط .دمت تكست عع م1 صمل 


عكتملآ ع8 ,0115م 170اعدت :11107 حهة 5 تتتتاكهعطط نلدع1 101 رتنع متك" (2013) .5 نتطمآ ٠‏ 
لاع تع 877/117 010تتطاعع] //201324/02 ا/حتامء.وع تنا 187971907.1[7//نصصاخط إتتمتطتاء8 23 ,وعصطتل]' 
.(2013 لتتحجكخ 1 لعووعءعة) لمسخغط.وعتان-01-ععمعك و -ه-ومماع ع0 
عتاطتام لاعت ننه لع1طاع 0101 :عع 7م طمع مع هتء-151121 :مغ م[صعم 20 (2011) .[ ,معدم]آ ٠‏ 
.5 --:- هه 22 7167ع2 2+0 ,7ع15مط حتوز1150' اع صاععة- صممط 


عم ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها 


امراجع 


.(2013 تاعطتطعامء5 16 4وووععع2 غ125) 01م :201105//10280-0517/حتامء 


1202//:صقغط عصدز 2 ه120 #والتعظ ”0 ,تععمعك5 هه 15 غخهط137* (2010) .21 ,5ع كلامآ 
.(2013 7إتقتتطته[ 28 0مو5وععع2 135]6) اتصغط.ععسعقك262-5ل-15 -تمطنوو//201006/حدم مجللئعده 


عط صذ عستحتغقط]' :قطهخلل1آ' (2012) .21 ,كنتسداللء21 مه .[ :821133 ,8 ,موعناآ ٠‏ 
.[[ بطععاهط20 روع111 صطمر رع م1معء8 مم ته مصسرمكم1 

//نطاغط إتتهتتتاء8 13 زتءعطتسصقطن عاططناظ عغطةآ' ,هغه0 عذظ .820 .علظ' (2013) .© واأكننآ ٠‏ 
.(2013 تإتقنتااء8 19 لفووععع2 غ125) /2غهل-عتطا-20 ادع ذا//1:6/201302ه اع طامسدحاءءع [حاطن اعط) 

ر(025هع15ذومهكء لمك50 له 4غ لمصوذضعم تععصه للع تند تتملرتع8' (2002) .(آ صمتو[ ٠‏ 
2242-7 :5 اع 50 2120 املع نطن لطهت ,دام ته صط1مكص1 

علتأطامحطة لصهة 5ع0ه0ء “عا 7اعطامء :هستتاهة لم50 5د ععطهذللئء17ن5' (20032) .([ دمج[ ٠‏ 
لهغخنع 01[ لصه عاكنظ رتوإعهكالوط يعستاءه5 لمدك50 كه ععصطوللئء17ناد ,(لع) .(آ يصمتوآ صذ ومعتلمط 
13-0 .مط ,00طه.آ رعع1011160 .متأو صستستهوزدآ 

تعاكة قطتعاوترزة ععطة[لئء501 عوطتم اع كمه :81115 02162 25 5أنزممعتة' (20036) [0.١‏ دمر[ ٠‏ 


.13-0 :1 راع ك50 قا وعنطاظ 220 1م1210 متهن ,1010122102 ,غ1 1 ع طاصعمع5 


106 1طحطةن ركتاه2 رع ع0 صخ :5610165 ععصذلائء17ن5 (2007) .مآ ,رمآ 


220 15أتاعكطز :عع طد[لأء:51ه5> (2003) .8 ,تفمتصلاء11 220 .[ رصداهآ8 ,.ك رصصدكل8 ٠‏ 
1ع تتام تكدء ععطهللئع15نى ص دمتاءع1امء 0262 +101 و5ععتعع0 عسغتاصصدمء عاطمتمعجو 


.331-55 :(1)3 راع 50 لله ععصد لاع ناك 


0214 لهكه:5 علط 4ه وععمدع لهك عط 0ه وعقتحدهم عط توصتلمعئ1” (2011) ..آ ,رطع تتم صمك13 


9 لوووعءعءة 1256) 706. اع صةم_ع طنلطعن_حطاء11م طنج ]/3 / 5 0 دآ /أعط. ج0171 تتهحطة. ركوو / /صاغخط 
.(2012 نع اماع هلح 

85 320 .نل ,أوتتاطاءته1]0 ,.خ1 ,10055 ,.[ يصتطعنا8 ,.ظ ,م16ه8120 ,./2 ,تقطن ,.[ ممكلتتقصهة81 ٠‏ 

4 متامتأتاء محطه0ن ,10120120602 101 تتعتاصمءظ8 أعرعلط عط1' نهغه2آ واظ (2011) “ى ,عر 


.عأتكتامم1] 010521 توعءمسمكاء81 جا تحتاءعملمعط 


95 ,روعاتطتقصسط لمغتوتل أوطتدعة :2غ02 غ20 15 عتتطهمع نا  )2012(‏ .5 عطء مم1 


.ععتاته/70100[25.015اعذاع:191//:صاغط نتعطاماء 0 28 ,5كله80 01 #وعلوع8 وعاععصف 
.(2013 لتتاججك 4 لأعووعءء2 1256) 1[ حاءدءغ 1ل د81 10-1040 7مطم 


عاطاقطتهة ك5 ,نا لتناممع عط امع تراك تقد 2 ,لدعوتط2ه2 صكآ' (2012) .81 ,متاأأعطاءضتة/13 
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/42438 تناع طعتته مطهح /حدمء. ع حتاءع[[معوع تناع[ طهطته)5نذ/ /نصاغط ,عصدز 7 ,عحتءع1امت موعتكزن 
.(2013 11277 27 4وووععء2 1256) ناماع -7جاك-201118521-522211 

عاطقلهء5 01 وععتاعة:2 ذوع8 لحته دعأصرءسلوط منج[ وعذظ (2012) .[ ممعضه11 مد .]ا رتم1 
1املآ 17ع181 م151 نع أ[عطد روصتصصد]/8 .ممتاتلء طفظطل8ا .قصطعأورة 022[ عسنالمعر 

نوطنا 01 عكة17 اكعط عط :عتتامدعمط كه أنه عط لصه تإخغد[ه0لمطغء81 (2013) .5 ,صمتع و1 
تامع اع تناع وطهتتع نوع //نتراغط نتءطصدع ه81 5 روععه1[ط :تاعكدعوط0 صولوء10 ,ععمعكة ونه 
.(2013 تاءطمطع ه81 15 لوووعععة 6أمدط) //038174/عتتطدع]/وععوام 

لم16 خقط صم جط1مموع8 ىل :هآ عذظ (2013) .>1 متعتكلددت امه .17 نتعئنء ططمطءد-تعتوة/1 
11111133 صطهز علصنتطط' مصة علتده11 ععتناآ 18 محم عوصهطات 

15 1101221012 ,ه1050 عع12019160 ,122105مكط1 ,0غ12' [(٠.  )2010(‏ ,ووع201دنء]3 
-0102102 كط - 2010/02 /غع1.2ن 1ن نتدع 10112210115 طة .101 / /نصاغط ناء طصدع :ه81 11,29اكتأتتوء 8 
.(2013 تلن[ 24 4أووعععة 6أوهآ) ددمل مودعم ل»ء171مصا 

له تولاط نمعع ةق 1ه دع 1[ه2 عط ننتء مبصنط18 د غناط عصدظ 2 غ1 غ510 (2011) .1 مسدعانعع/1 
50ل ععدطعك5 [هء1 2011 حنهء تع دطة عط 101 لع نتممعتام تعمد .01]آ عطا صا 2غ02آ مصعم 0 
/5.551:13.60173ء جزة م //:صاغخط .2011 نتءطاتسصعامء5 1-4 ,دامأوصنطاعه؟11 ,علغدء5 .عصناءء/8 امتسسم 
.(2013 أقتاكونتتث 19 0ءؤ5وععء2 غ135) 10-1899790_غع25]12؟تاء.وتء جرةم/5013 

2 ,اء87] عاخصمحطع5 ,أطء18 عتاصمحطعد عط لحته اماع اعت طتخصظ' (2009) .0آ بلتدع 21 ٠‏ 
5 ح[]_مداع17- ع1 ته مداع - عط - ل حته - جاه تا 2 عع - تر تداع دمع .جاع تناع أطت حطع5/ /نصاخط ‏ فاطو[ 
.(2013 تإلدز 19 لعووععءة 56د1) 

+7 راع 010 10 بأع5112111125122.1 ,ته تمع هقط عط عسكاء د" (2013) .5.6 ,دمعكاء131 
.(2013 تتعطمغء0 21 لفووعءعة 125]6) /دمطنهكءمط-عطل)-عسمتاءج//201310/ع108ط/اع0.صعة ستتهحاة 


,رووع21 20117 .تمناء 01م سآ لدعتاتين ل :اانتوعناه8 (1994) ..آ رجهلل81 ٠‏ 


لقطخناه][ تعصتععتل عط ع1 صل[ تاماك .عتعط كذ عطعصهله؟2 غ2 عط1"” (2010) .8.1 زتع11نك8 ٠‏ 
181-17 :(500)1 ,ععمصعك5 لهدصمنوع] 01 


م5607 12017160586 220 قتقتصتطط 062 عنتطمهيعمء' (2009) .[ مصوآط ممه .[.8 زتع11ن81 ٠‏ 
4 قصتصتاطا 1024 عنتطمهضومء© ,(قلء) صم .[ لصه 84011 .11.1 ص ,معتمعه حنهة 
.3-2 .22 ,مآ ,نتعصدءظ مضه دماترة1' .تع ومعونجآ ععلع انمسر 


لهن50 ,0221 وعع ناعم ع2 [تاعلمء تقطم1 :كتاء ط لصتم بإ عصتصيع:ه00' (2001) ,2 رتع11ن81 ٠‏ 
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.379-66 :(68)2 برطاعتتوعوع11 


7 .20 اأأمجعظ] عتم ه10 ' 4012 12م251ء .اأتاعصستصضع:601© لطه هغج0آ لعكلصنآ (2010) 28 زرع81111 ٠‏ 
0-تاع ممتطناع مع -0 نه -28 0-0 ع علط ذخ[ - 011-10-7 جرع :1-ء ذجزم] /خداع حدم /ناء. مناه 12م -ذومع / /نصجاخط 
.(2013 أكتاوتتكث 14 0وووعءء2 ]135) 

عناطتام 01 بإامأقتط عط1"” (2012) .1 وإعصصوظ له .16 كاعمسصلط ,.ى ,وستطدب]آ-831111 ٠‏ 
وأتاع مططهعتحصظ عط له «وع16معء8 صا عناصم لطءممعوع؟ لمعلعه16معء صذ مم أحهمرك قوم 
.285-90 :(10)6 

نالك 6 عتأاصدلاة عغطص' مقصنطا 4ه عمستومعماتق عط نصمهة عسصتصدمن" (2013) .0 ,كستكاخ8 ٠‏ 
-5-50012-12 نحط م» // 201308 /ع تخقطء 2 /تإع 10م ططءع] /حامء .ع تغخطة اخدع .17م / /نصاغط 
.(2013 أكتاعتتظ 7 0لوو5و5ععع2 1256) /278409/دعقطتطا-أه-ع مستي مات 

و1111 .دع رولمصك واظ ,غ102 عاظ (2013) “لكل رزهختطلآ مصة .21 رو طمصقطنت ,.31 ,تلاعصتكخ3 ٠‏ 
.[[آ ,مععامطه1آ]1 

11056طتصهن رووع:2 2/111 .ممصطغتممولكخ عتاعدء0 مغ دمناء نل مغاص]آ صخ (1996) .31 بلاعطء31 ٠‏ 

لمتلهم؟ 0ع72عمدعع معتتكتن' (2011) .آ بضهلا مه 2 ,طهتامء01ن ,.آ11آ ,طناك ,8 وإعدهه]8 ٠‏ 
1021 تاعاس1 2520 عطا أه موصتلعءءء 20 ,نوع تصصخ 1هجزجزه لصه 1د ندم ته كص مه مغه 
,(2011 171805ن10) ععمعك5 ناعأ امطده له عطتاعءعصتعصظ عدم ماع81 جه ععماعرعكمه 0 
- 1ل حا - 7ع حده 18/10 /وناء ره 12ع]51وطاء7/17[ع011 0 تتا /ع1. مصتتتتطا.وء.19710717//:مأخطرمستطت 2 ,كتطمففطد 


(2013 2177ناطته[ 28 0ن55ععع2 0-1/13772011.501)135]6ع]تمتتطان1ك 


مأتتاءنتك 11872664 0210 012201215 122016 عصتستصسهمن' (1965) 2 .8.© ,ع:زه810 ٠‏ 
-5 111ل /تاكة.آ_وع:12/1/1001ناء كنتحطة /حطامء .اعغخطة.20هلد 1ه //:صاغخط 2  38)8(,‏ ,وعتطمتاعع181 


.(2013 21377 20 لعووعءء2 56د1) 01م.عاءناتشظ_1965_ع11001_<ه060100/روء25ء1عظ]1_ووع 21 


111560177 تتواع ا[ 2 101 وأع8100 أعوعناوطك :وعع]' ,وصة81 ,رقطصه:0 (2005) .1 ,تاأء:2101 ٠‏ 
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.(2014 7إتلقتتطة[ 6 


-21025-01ع12115انو لتة ,قصتلمء روعةتستنوع1 :(1)5ع20مط 1222  )2011(‏ .21 ,ه1115 
857 :29 رعع0م5 220 #رإاعك50 :10 قستصصة اط 0ه اداع مصسم ع حمظط ,111 


وأطعع 16ل 15 عناممط - عنتممط أكناز لوز عنامحمط عدتتوععط :عع2 عات(طماعم عط1" (2008) لععتتلا 


أ135) متخطذ_حام/- 1607 /عط تمدع ححط /وعتاع077ء 15ل /عع عق ؟ /حتامء.0ع9710707.1711//:صاخط ,عصنز 23 


.(2012 تع طامطء8107 9 0عووععع2 


10.1 تلط 2251264 ,كتاعتطاده5ه1تط2-مع1ع0.]آ كتطوغعة12' ([1921]1974) .آ ,ستع]أممعع 11716 


,15011116086 .655 7طتناء21 .8.1 لتتة وتوعط 


لماه تتعوعتطا معي اءع1[امء ما لعع7 ع تروطتو مضه بإعذلله نه عتط عط1"” (2012) .21 تكلا 
-15-02168-ع201225/11//1 لحتامء. اع تناع طاءعا //:صاغط ‏ ناءعطصع8107 25 ,طعصتضمن طاعع]' 
8 ل0وووعععة 1256) /دخطع اقطذ-210-9018:289909080حامكصذ-10112(7-0262-9018:289909040 

[3211217 2013( 


لط لامأمسمةمكصآ 1ه للد لصه عمتظ عط]' تطعكتوك 83156 عط1' (2011) .1 ,تكلا 


01:1 جع[ ,عع صما 


00812217 هطنانآ ,نحصو كتازوهم(050م) 0عغأ2متاماسخ' (ووعام صن .8 رجاتتلا 


صا 1024 عنتاطنا2 معم0 06 عقتصطوضط عط عصنتللفلهظ :ه102 مغ غطونظ لى (2012) .0 ,متلا 
/كلنا.018.ع1318ءةء 0117 071707.2//:صقط ,عاأهل8 طامجوعوع1]3 عوسقطعرط بعناه .كاآنا عط 
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امراجع 


-ء 1[طنام -دع ده -01-عء ونحدهن1م-ع ط ادع تللق [ن- هه -0-غاع 2-1 /صدعغ1 /تتمععغهء/ددمنغدء ناطناط 
.(2013 أقتاعتتك 14 0وووععء2 ]125) علدا-عطا-ستحهغه0 

120171608 0ع 1ععاط1 10173105 :5751125 51122011 ااعطاعع2 صدل8' (1987) .11 وتسماءعت ٠‏ 
.59-60 :7 ,]1212ع 21/121228 577566125 1111122132 ,2ع مادعع 112113 

,5 121210116ءع 2120 11:21126101:125 ر5ق15511 :1221131138 ع8 11222" (2001) .لآ رآ 220 .11 ,1513آ ,..[ ,22285 ٠‏ 
غ )125‏ 231[77001-10.1.1.4.8726تمتتاو/ء 700اع 71 لتتلع.تاو«. ]15 عداءء دعاك //نصاخط ‏ وحتعود5ع 1ن 
.(2014 7إ1قتاطو[ 17 564وعع26 

85 »2 ,لمآ 220 1١‏ رتك 5غأقاء10آ ,.0آ ,0615003 ,.ن) ,136013 ,.ن ,2 ,011103 م مكلذ ٠‏ 
011 1ع81 ,اانا كه نماء81 .1228 عذظ 
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المترجم في سطور 


د. محمد بن أحمد علي غروي 
المؤهل العلمي: 
- دكتوراه علوم المعلومات؛ جامعة نيويورك الحكومية: الولايات المتحدة الأمريكية, 11١٠م.‏ 


الوظيفة الحالية: 
أستاذ تقنية المعلومات المساعد في قطاع تقنية المعلومات بمعهد الإدارة العامة بالرياض. 


إنجاز العديد من الدراسات العلمية منها: 

025 نأمط اعغتامططهب) عاقهة8 عصلووءدمث .(2015) .81 ,وزمطكا ع8 .81 ,اكهتقطن 

م5021 04 0111221[ 260231 تاعاس1 .مأطهمخ 101ه5 صطذ وأخطعلهند عع آ-ععء11ه00 4ه 15لكادة 
:810 ,9 :1701 عتتاعع طتأعططظ الاعططعع 11222 لحته عتحطمحامءظ ,اهدهم دعنك ,لهدمه تحهباء8 

كعنك التعسصصعم5 عساطكتامعل1 .(2014) 1" ,9[ةامصه[ ,1 ,تعععاوظ .801 ,كه تهطان 

12.0 .تأطهعتك نهد 5ه عقدء عط :قلعع7 عصتصنهتنا له حمتخوعسلء تتعع اه امه ترمكص1 


2014: 280- 9 


51 ع1076متطظ وطتووءودة .(2014) .(آ رقتصاأه2 ع8 .11 ,012122101 ,.كآ ,تلقطاومء0آ1 
اول ولعت تاهب م نغونء م000 كلنا0 عط 1ه سوعيوه:2 عصتستدم]' عتممجاءعا8 عط 1ه 
قاع متطتاء6017 ,001200126 تنا عوسمتصتوع .8-1 جزه ععمعنعغده0 1101104 04 ووصنلءءءه2:0 مآ 
.(497 -488 .نزم) مدع مك8 تاتعطونط لصه ,عنتدع طخلدع11 

29 0121211211 01 ععطع تالص[ عط عصتده [صدظ .(2013) .5 روع59د0آ ع3 ,./1 متحكه تمان 
01 56107 عكتخهتهمطدهن ىل :يكلةمساعآ8 ععل0ع171م ]ا «ماءء5 عناطتط لهصمتأفصخصةت]' جره 
غ46 عط غد لعأمصعوعم تعمدط .وع157أة نتم[ 211055-[ز2]2 عط لمعه خهتاوسمطاد 112101-1م 
خنه81] ,تتحه]/! ,(11055-46]) وععدعك5 متعاوز5 جه عع عع مه 21م نه منتعاص] اتدكوك1 

دعن ناعم عوصقطععدظ عسصكمع لم1 5دماعد8 .(2012) :1 ,ملمدط ع8 ,.81 ,تمان 
0ك .111255-ززه8 عط 2ه عمدن عطآ' :كاامماعل8 عقلع12011 22[1م م صقصهةا صا 


2 -113 ,322 روع1تاءع5 ع ع2 عع طعاع 1ط 0 210221 لانتعام]1 
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عنمطعلدعة عط عصنللنها8 .(2012) .21 ,ااكمتقط6 ع2 .1 ,صتدلط ,.[ ,قطم][ ,.5 ,مكامزدآ 
01055-80120217 ذاه طعتتهعوع18 ااعطصصء18-0061 01 بباتصمتنتستصره 6 
210221 مع م1 لختدسكمط 4505 عط غد لع 7عوعمم تعمد .ومعهمطاك مه «مغهضموعغم1 


أنه ,لنتد]/! ,(11055-45]]) وععطاعك5 متعاوز5 داه ععطع رع مه 


220171605 ناماءء5 عناطنا 751210221هظ]' .(2012) .8 رتنا ع8 ,.]/1 ,0121:2511 ,.5 روع10351 
ع0 لهده أمسصع حص نل 81 2 صذ عممهاك هتاه مسصمكص] لمصة ععلع1امص] :جمس اعادط 


.5112-0 ,(2901 01121117 ه0110 كد] غخداع تصصرع ه00 


5113118 11011226101 لحتة عع0ع171مصك]آ .(2011) .8 ,عكاتتتاظ ع8 .81 ,2125© ,.5 ,و1021 
علا غه لعأتعوعم تعجة2 .عكتاءء موء2 21 تعر هن ل :11م واعآ8 عق1]22017160 1هده نه موصة]' 


نه] متمتتكا ,(111055-44) وععمعك5 متعاوزك جه ععطع ع دهن لهام تاه ممعاس] هحلط ج44 


01 لصه ععق0ع1]2011 عستعتلمنامععده0 .(2010) .5 روعكة0آ ع8 .11 ركه تهطان 
طاك عطا غهة لعغمعوععم عمو .ماعل عول»ع2011آ1 لهدمأمصخصهء]' صذ عسمتتهطاد 
ععتقطاء601 عتدمماءعا8 1ه ععتعهة2ط مه تزتمعطط' ده ععمععغمهت لهصمتأمسمعام]1 

قصتطت ,قصازء8 
15 ]0 2[7515نة ع كتاصتكوع10 لك .(2010) .11 ,6212591 ,لل ,.0آ عأوو1صاءجآ] ,11552ه] 
5 تنا تاداع حططمز ماع07[ عازوداء117 الاعستطلء017 18-0 1[ .لاع ص01 0ع متهزوظ 01 


54ت] :1ه دعك810 غه عوع11ه0 51011 رتإعم ه12 80 .قواع7100 عأوعندند لصه 


5 :0111115 1500 01 م121" ل .(2010) .(آ ع1أوو1ططء12] ,.11 1)كة21 0 ,.لل ,11011559 
أنه 4310 عط 1ه ووصتلعءء 2:0 .وعغزواء117 اتعسصمنءمع18-8 مداوخ له سمعتكط ]ه 


11351 ,تفتتهكا ,10102 ,(511055-43]) وععمعك5 تاعاأورك جه ععمع ءامن ل1مدم ته صمعغاص1 


20101 101 وعذع 51126 220 15535 .(2009) .5 رماع 1ع نات ع8 ,1" ,22100 ,.1/1 ,الاتد ته انه 
210281 عام للاعمة .طعتوعوع18 عكتأه حدمت امعسصمع ومع -18 لأهممتتواط!-ووم 1ن 
.70 -163 ,322 ,وعلء5 عصتلععء2*0 ععمع رع مه 

5 ططخ ]1 عحتتحاعدعء1' :101 جاععع م5 ن1ع غ1 مده .(2001) .11 ,1131:5916 2101 ,. لك راع ستطة 11 
رعناعة21 ,رقصتصته1' 4ه حامتخهعت 80 101 ععمعنع مهن لهم نه صمعام] عغطآ' ,لصنتاظ عط 6 
.عتاطتامع] طاععدرن 

101 [ع1100 طعغه117 عط2000(.'1) .11 ,011312591 220 .كا متخصتة11 ,.[ يوكلتخحه/13 
51 عط كه وعصتلعءء210 ,رقطه د تصدع 01 21105156 لخته المحدد طذ عنتدوكاكه5 ووعطامما8 


,01122010 ,1 عت1مم؟ 
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أبرز الأنشطة العملية: 


: 
1 


عضو اللجنة الرئيسية لمبادرة البرنامج الوطني للتدريب عن بعد. 17١/ام‏ - الآن. 
عضو الفريق الوطني لبناء إطار حوكمة التعليم والتدريب الإلكتروني بال مملكة العربية 
السعودية, 17١٠م.‏ 


. عضو الفريق الدولي لدراسة احتياج المهارات الوظيفية. صندوق اموارد البشرية بالتعاون 


مع جامعة هارفرد. 0١م‏ 


. عضو الفريق الوطني لقياس التحول للتعاملات الحكومية الإلكترونية (قياس) 7:10- 


الان. 


. عضو الفريق الدولي لجائزة الإنجاز في التعاملات الحكومية الإلكترونية (إنجاز) 016١م.‏ 
. عضو الجمعية الدولية للحكومة الرقمية (2©.0) 7١١١‏ - الآن. 


. مدير مشروع إثراء وتنويع مصادر ال معرفة العربية 5١١"-الآن؛‏ معهد الإدارة العامة 


الرياض. 


: مشرف على برنامج التدريب الإلكتروني 7م -5١١٠م؛‏ معهد الإدارة العامة. الرياض. 
. باحث ومدير برامج 9٠٠7م‏ -١11١م؛‏ مركز أبحاث التقنية الحكومية» نيويوركء الولايات 


المتحدة الأمريكية. 


.ما٠١١ا/- "م‎ ٠١١ تنفيذ عدد من الاستشارات للجهات الحكومية با مملكة العربية السعودية‎ .٠ 
.م1١١ا/-م‎ ٠٠١ تصميم وتطوير العديد من البرامج التدريبية في مجال تقنية المعلومات‎ .١ 
المشاركة في العديد من ال محافل وامؤتمرات المحلية والإقليمية والدولية.‎ .٠ 
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مراجع الترجمة في سطور 


د. ماجد بن عبدالعزيز البريثن 

المؤهل العلمي: 

- الدكتوراة في مجال أنظمة المعلومات والتخطيط الإستراتيجي للمنشآتء جامعة سالفورد 
بريطانيا .)75١١1١(‏ 


الوظيفة الحالية: 
- أستاذ مساعد بقسم نظم المعلومات - كلية علوم الحاسب والمعلومات - جامعة الإمام 
محمد بن سعود الإسلامية. 

الخبرات العلمية والعملية: 

- عمل عضو هيئة تدريس بقسم تقنية المعلومات والاتصالات بكلية الملك فهد الأمنية. 

- عمل محاضراً غير متفرغ بمركز خدمة المجتمع بجامعة الإمام محمد بن سعود. 

- الإشراف ومناقشة عدد من رسائل الماجستير. 

- حضور ونشر عدد من المشاركات العلمية بعدد من المؤّتمرات والمجلات العاطية. 

- عمل مستشاراً بهيئة الهلال الأحمر السعوديء ١11‏ - حتى الآن. 

- عضو فرق عمل ضمان الحودة لشركة 051-1266+22100281 فيما يخص ضمان جودة 
واختبار برمجياتها (2757170) تطبيق إدارة وتحليل البيانات الوصفية. 

- العمل مستشار لأمانة مدينة الرياض في تطوير مشروع مركز الاتصال 56٠‏ . 

- العمل مع إدارة تقنية المعلومات بالمؤسسة العامة للتقاعد على تحليل بعض ال مشاكل 
القائمة. 

- العمل على تطوير أنظمة حاسوبية لشركة القصبي. 

- العمل والإشراف على تطوير عدة أنظمة حاسوبية تطبيقية بكلية الملك فهد الأمنية. 
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- القيام بدراسة تقييم تطبيقات أنظمة المعلومات من حيث النجاح والفشل ومن بينها 
نظام الإسعاف بممدينة لندن وكارثة (1,85105آ) عام 11917م. 

- دراسة تحليلية لتطبيق نظام 818 لإدارة عمل جمعية الهلال الأحمر التركية (1105). 

- القيام بإعداد دورة تدريبية خاصة لطلبة الدكتوراة في قسم 1115 بجامعة سالفورد فيما 
يخص العمل على نظام التحليل الوصفي للبيانات 2117100. 

- القيام بإعداد دورة تدريبية خاصة لطلبة الدكتوراة في قسم 11815 بجامعة سالفورد فيما 
يخص العمل على نظام الفهرسة الإلكترونية ع502011016. 
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حقوق الطبع والنشر محفوظة لمعهد الإدارة العامة ولا يجوز 
اقتباس جزء من هذا الكتاب أو إعادة طبعه بأية صورة دون موافقة 


كتابية من المعهد إلا في حالات الاقتباس القصير بغرض النقد 
والتحليلء مع وجوب ذكر المصدر. 





تم التصميم والإخراج الفني والطباعة في 
الإدارة العامة للطباعة والنشر بمعهد الإدارة العامة - 699 1ه 


هذا الكتاب 

اا 0 
ا ا ل ا ا لا ل ل لماه 
وخليل وتبادل البيائات, وما يعني هذا لكيفية إنتاج واستخدام المعلومات والمعرقة: وهو. من 
جهة أخرى. مهد للنقاش والتفكبر النقدي حول البيانات من حبيث طبيعتها, وكيقية تأطيرها 

من النواحى الفنية والفلسفية والأخلاقبية والاقتصادية والتجميعات التقئية والمؤسسبة 
الحيطة بها. ويستند التحليل المقدم قي هذا الكتاب إلى مشاركة واسعة النطاق وإلى ما 
سبقه من مؤلفات في مختلف العلوم. والعلوم الإنسانية, والعلوم الاجتماعبة, ومن مطبوعات 
الثقافة الشعببة, والإصدارات الصحافية, والدوريات الضناعية:؛ وإلى خبرة مباشرة في العمل 
على أنظمة حفظ أرشيفية وبنى ختية ومشاريع خليلات لبيانات على نطاق مؤسسي واسع. 
وبنقسم الكتاب إلى أحد غشر قصلاً. يقدم الفصل الأول نحة عامة ونقذا قكرنا حول مفهوم 
البيانات وكيفية فهم قواعد الببانات والبنى التحتية للبيانات. في حبن يبحث الفضل الثاني في 
الدور المستمر تلبيانات الصغيرة والكيفية التي تم بها توسيع نطاقها إلى أرشيفات/محفوظات 


رقمبة وبنى ختية, الى أن وصلت إلى درجة التداول وتيعها من خلال وسطاءع الببانات. كما يناقش؟ ء ي - 
الفصل الثالث الدافع للتوجه نحو استحداث البيانات المفتوحة والبيانات المرتبطة », ا م 


التى يجري تقاسمها ومشاركتها وإعادة استخدافها على تطاق 31 70 ْ 
ا ا ا اال 0 : 
بالتفصيل وعوامل التمكبن للببانات الكبيرة وَمضاذرها : 1 
المساعدة على انتشارها. ويقدّم الفضل السادس حة 1 7 
غامة عن مجموعة جديدة من خلبيلات الببانات 0 
التي ثرمي إلى فهم البيانات الصغيرة المؤسعة : : ء 
والبيانات الكبيرة. كما يدرس الفصلان السابع." , 1 

والثامن الحجج المستخدمة لتقزيز البيانات - * ل 
الكبيرة والترويج لبها وبيان تأثيرها في 5 7 ا م 
الحوكمة والأعمال. 001 -5 تضوم. , ٍِ" عن : 2 
بها ثورة البيانات لإعادة تشكبل كيفية '. ١‏ : 1 
تصور البحوث ومارستها. ويناقش " ». .. ', 0 1 ا 


الفصلان التاسع والغاشر التحديات ٠ «٠2‏ اذك ل امي حيو مد ار م ب , 


التقنية والتنظيمية, والأخلافية ف "2 5 ان ناهر ا 
والسياسية: والقاتوئبة لتورف 4م 1-2 , اراس قي ور ماسر وكيد ا 


البنانات. ويحذد الفصل الأخير 00 
م جب 3٠‏ © || ااااااااااللانا 
ويقدّم خارطة طربيق لإجراء " خب ورء 


المزيد من المحث والتأصيل. 


9 9 6 0 1 4 2 6 5 65 


1 5 1 8 00 
. م ه+ : : , 


تصسم واخراح وطباعة الإدارة العامة للتشباعغة والنشير 1 -. 0 3 -550 159" ون ا 7 يد 
١ 1‏ 


مفهد الاذارة العامة 1515اهض 1 : ل بخان لال و 0 


0200 5 . 8 ١ "9 35 
#اى لغ‎ 5 ٠ 5 





